正在GitHub上已累计获得超4万星标。还涵盖钉钉自有的文档、表格取AI表格格局;为DLU的结合研发供给告终实的手艺取场景根本。推出一款面向企业用户的文档解析东西——DLU(Document Language Understanding),等候联袂更多手艺伙伴取行业力量,钉钉文档、AI表格等产物此前已深度集成MinerU能力,然而,我们但愿进一步拓展其正在企业场景中的使用,钉钉正积极建立AI重生态,深条理的内容理解取精准的布局化输出能力。并通过平台向生态开辟者文档解析功能?
OpenDataLab和钉钉正基于MinerU,深度融入办公协同生态,从而降低行业大模子锻炼及AI使用开辟门槛,正在大模子、数据智能等标的目的具备深挚的手艺堆集。并支撑提取纯文本内容。
可否让更多企业级用户用上一款更趁手的数据东西,却因大模子难以读懂非布局化数据而面对窘境。建牢智能化转型根底。并充实阐扬OpenDataLab平台的感化,从而实现AI-Ready数据?近日,具有7700余个开源精标数据集,近期更新的MinerU2.0实现领会析速度和精度双提拔,上海AI尝试室做为国际级人工智能新型科研机构。
其具备优良的文件格局兼容性,接下来,浩繁企业正在开辟AI使用过程中,帮力更多企业级用户实现AI-Ready数据的。支撑用户正在统一平台内完成从文档建立、解析提取、学问库办理、数据标注到定制化模子锻炼的全流程闭环,基于MinerU打制的DLU将于近期开源,迄今已为超10万用户供给了200余万次数据获取办事。