(电子商务研究中心讯) 1月24日获悉,“拍医拍”宣布获得了三千万元A轮融资,并将产品发展方向正式从C端转型到B端合作。
对于OCR(图片文字识别)技术,移动医疗并不是没有人做,像杏树林、珍立拍、易诊肝病等都在进行一定的尝试。可能和知名度有关,杏树林受到的质疑声比较大,业内人士表示,杏树林在无锡有一个上百人的团队专门做信息的手动录入。可见图文识别技术的重要性和实现的困难程度。
拍医拍的核心团队成员都有很强的技术背景。创始人兼CEO吴施展是原来赶集网首席DBA、技术保障部总监,曾负责百度商业数据库团队,有十余年的大流量高负载互联网开发及架构经验,有丰富的大数据管理和挖掘经验;联合创始人刘立是美国伊利诺伊理工学院博士,原天津大学信息工程副教授,计算机视觉与医学影像专家,申请国内外专利三十余项,在医学成像、医学影像处理、图像理解等方向有丰富研究与实践经验。
做图文识别最强的要数百度,拍医拍的联合创始人杨琼就是百度OCR和人工智能领域的重要负责人和推动者,也是百度最早推动深度学习进行文字识别、图片分类以及大数据分析的重要人物之一。杨琼先后任职于微软亚洲研究院、欧洲微电子中心、百度深度学习研究院,是文字识别、人脸识别、深度学习、人工智能、大数据分析等领域的资深专家,拥有11项世界或美国专利。
据亿欧网了解,目前拍医拍的技术团队主要是由杨琼博士建立起来的。团队中也有医疗北京的创始人,拍医拍的联合创始人杨劲松从医15年,是原云医App的首席医疗官,也是好大夫在线第一任医学总监。
其实图文识别技术和我们的生活非常贴近,最常见的应用可能是名片的识别,拍医拍的原理和它非常类似。但由于拍医拍是专门应用在医疗领域的,因此从技术的角度难度更大。
第一个难点是清晰度的问题。和名片不同,病历的纸张较大,同样拍下一张图片,识别病历的难度会更高。
第二的难点是医学描述不统一,同样一个信息在不同的医院和科室可能有不同的表述方法,这很大程度上影响了信息的结构化。技术能否实现对自然语言的理解和再学习,是解决这一问题的难点。
第三个难点在于新技术的出现。随着医疗的进步,有越来越多的新技术可以对疾病进行检测,比如,近期火爆的基因检测。而图文识别能否对这些最新的检测技术完成数据的结构化采集,是这一类公司面临的有一大技术性挑战。
对此,吴施展对亿欧网表示,拍医拍的团队有能力应对这些难点。目前,拍医拍主要处理四种信息:厨房、化验单、检查报告、住院病历。从数据上看,拍医拍识别常规化验单的准确率超过90%。(来源:亿欧网)