microsoft
/

layoutxlm-base

Inference Endpoints

Model card Files Files and versions Community

layoutxlm-base / README.md

Yiheng Xu

Update README.md

0b0e209 over 3 years ago

|

838 Bytes

	---
	license: cc-by-sa-4.0

	---

	# LayoutXLM
	Multimodal (text + layout/format + image) pre-training for document AI

	[Microsoft Document AI](https://www.microsoft.com/en-us/research/project/document-ai/) \| [GitHub](https://github.com/microsoft/unilm/tree/master/layoutxlm)
	## Introduction
	LayoutXLM is a multimodal pre-trained model for multilingual document understanding, which aims to bridge the language barriers for visually-rich document understanding. Experiment results show that it has significantly outperformed the existing SOTA cross-lingual pre-trained models on the XFUN dataset.

	[LayoutXLM: Multimodal Pre-training for Multilingual Visually-rich Document Understanding](https://arxiv.org/abs/2104.08836)

	Yiheng Xu, Tengchao Lv, Lei Cui, Guoxin Wang, Yijuan Lu, Dinei Florencio, Cha Zhang, Furu Wei, arXiv Preprint 2021