LiLT

Как оказалось датасет, на котором обучали LiLT - IIT-CDIP (доступный для скачивания здесь) весит 1.41 Тб.

Поэтому добрые люди создали поддатасет RVL-CDIP, ещё и добавили в huggingface.

  • FUNSD - на этом датасете дообучали

В качестве датасета для NER задачи на Android Layout был выбран RICO-WidgetCaptioning по результатам Gemini Deep Research