当前位置: > 全球贸易 >

最新国际文本检测权威榜单发布:中国包揽前五

发布时间:2019-01-04 19:59:54

2019亚洲杯投注app 最新世界文本检测威望榜单发布:我国包办前五 云从科技夺冠-财经 光学字符辨认(Optical Character Recognition,以下简称OCR)是指剖析图画然后获取文字信息的进程,不少

  2019亚洲杯投注app最新世界文本检测威望榜单发布:我国包办前五 云从科技夺冠-财经 光学字符辨认(Optical Character Recognition,以下简称OCR)是指剖析图画然后获取文字信息的进程,不少智能手机中的手刺扫描软件就有这一功用。
2018年11月20日,OCR范畴的重要目标——世界文档剖析与辨认大会(ICDAR)测验集被再次改写,我国高校及企业包办ICDAR2015排行榜前五,依次为云从科技(Pixel-Anchor)、南京大学与南京理工大学(PSENet)、旷视科技(Mask Text)、商汤科技(FOTS)、阿里巴巴(IncepText)。
世界文档剖析与辨认世界会议 (International Conference on Document Analysis and Recognition,ICDAR)是由世界模式辨认学会(IAPR)安排的专业会议之一,专心于文本范畴的辨认与使用。为了进步天然场景的文本检测和辨认水平,世界文档剖析和辨认会议(ICDAR)于2003年设立了鲁棒文本阅览比赛(“Robust Reading Competitions”)。至今已有来自89个国家的3500多支队伍参加。Google、Microsoft、Amazon、Facebook、北京大学、我国科学技术大学、腾讯、搜狗等均曾参加其间。
鲁棒文本阅览比赛的测验数据集一直在网上揭露,可以随时提交效果,是天然场景文本检测职业中查验算法的测验数据集。ICDAR2015和ICDAR2017 MLT就是其间两个测验子集。
汹涌新闻采访了现在坐落ICDAR2015榜单榜首名的云从科技。云从科技研究院本身算法工程师李源介绍,CDAR2015和ICDAR2017 MLT是天然场景文本检测范畴的威望数据集,“基本上一切文章都会在上面检测”。

  CDAR2015榜单(2018年11月20日)。F值代表精度和检出率的谐和平均数,也是排名的依据,F值越大,检测效果越优。
最新国际文本检测权威榜单发布:中国包揽前五云从科技夺冠-财经他为记者解读了这份榜单,精度(Precision)代表检测效果中正确文本的份额;检出率(recall)则反映被检出文本与图片文本总数的份额,可以表现是否漏检了文本。为了检测算法的作用,需求归纳考虑精度和检出率,而F值正好代表精度和检出率的谐和平均数,也是排名的依据。
最新国际文本检测权威榜单发布:中国包揽前五云从科技夺冠-财经需求留意的是,这儿说到的天然场景文本检测并不等同于文本辨认,前者不具备辨认文字的功用,而是指在图片中检测出文本。
李源表明,2018年11月20日,云从科技在预印本网站arXiv上宣布了最新论文效果,该论文提出了用于天然场景文本检测的Pixel-Anchor结构。论文宣布之前,他们在世界文档剖析与辨认大会发布的ICDAR2015和ICDAR2017 MLT数据集上检测了Pixel-Anchor算法,并改写了ICDAR2015的最佳成果。
据悉,ICDAR2015是纯英文文本检测数据集,ICDAR2017 MLT则包含了拉丁文、英文、中文、韩文、日文、阿拉伯文等9种文字。云从的Pixel-Anchor算法在ICDAR2017 MLT归纳榜单中排名第四,排名前三的三家国外组织没有提交揭露论文。

  ICDAR2017 MLT归纳榜单(2018年11月20日)(带*号表明没有宣布揭露论文)
除掉没有宣布揭露论文的几家组织,ICDAR2017 MLT数据集前五名及结构称号分别是云从科技(Pixel-Anchor)、阿里巴巴(ATL-cangjie)、商汤科技(FOTS)、旷视科技(EAST++)、南京大学(PSENet_NJU)。
ICDAR2017 MLT的中文榜单中,云从科技排名榜首,商汤科技位居第二。

  ICDAR2017 MLT中文榜单(2018年11月20日)

  天然场景文本检测事例
但相较于传统的文本检测OCR,天然场景中的各种产品、布景或天然场景图片中的文本检测与辨认面临着杂乱布景搅扰、文字的含糊与退化、不行猜测的光照、字体的多样性、笔直文本、歪斜文本等应战。与针对高质量文档图画的传统OCR比较,天然场景文本检测能在更广泛的范畴中使用,例如相片剖析、车牌辨认,图片广告过滤,场景了解,产品辨认,街景定位,收据辨认等。