联系我们:010-88559646

  老师群

170086145

  学生群

179326524

209318323

215410234

客服电话:010-88559646

Online Store BusinessInformation Picture and Text Extraction

时间:2017-03-22        来 源:中国软件杯

Topic: Online Store BusinessInformation Picture and Text ExtractionGroup A: Undergraduates or above
Topic introduction: Explaining the whole idea andrequirements of the topic

In accordance with provisions on publicity of onlinestore business license information of Measures for the Administration ofInternet Business issued by SAIC, owners of Tmall stores need to disclose thebusiness license information. However, structured handling is not available forpicture information, and the company registration number and company name inpictures need to be extracted to form structured documents.

 

Topic scenarios: Describing the business scenarios ofrelated real companies, and simplifying or extracting proper competition scenariosfrom the real ones

Where statistics on business of Tmall stores of someenterprise is required, Tmall enterprise information should be collected forstructured handling first. In the case, competitors can extract textinformation from 50 Tmall enterprise pictures provided in attachment and then deliveran Excel document gathering the information.

 

Functional requirements

1. Read the folder path of company businessinformation pictures automatically through procedures.

2. Take out pictures from the folder pathin sequence and then perform picture identification.

3. Create procedures matching pictureextracted information of different formats since pictures public on Tmall haveno fixed format.

4. Extract data about company registrationnumber and company name from pictures, and store the data in Excel, whereinsince the data needs processing, it’s essential to ensure that the extractedinformation is accurate and that the identification accuracy is up to 95% or above.

5. Deliver Excel document gathering finalidentification results in the format as follows:


Non-functional requirements

Keep the speed of identifying 50 pictures every 60seconds.
Other restrictions: Development environment, testplatform, development language, database, complier, etc. (as explicit aspossible)

Development environment operating system: Windowsor Linux

Developmentlanguage: C++ or JAVA

 

Test data or platform: Test environment and dataprovided to competitors (electronic documents are acceptable)

Original webpage picture information:


Identified data information:



Instructions about development equipment and equipmentmetricsNone
Other requirements

Competitors and relevant companies share intellectualproperties and codes achieved in competition.


主办单位

工业和信息化部

教育部

江苏省人民政府

承办单位

中国电子信息产业发展研究院

江苏省工业和信息化厅

江苏省教育厅

教育部高等学校计算机类专业教学指导委员会

信息技术新工科产学研联盟

执行单位

中国信息化周报

南京江北新区产业技术研创园

江苏软件产业人才发展基金会

南京市软件和信息服务集群发展促进机构

南京航空航天大学

关于我们

客服电话:010-88559646

邮编:100048

联系地址:北京市海淀区紫竹院路66号赛迪大厦18层

网站备案/许可证号:京ICP备05039896号-10     京公网安备 11010802020860号