(電子商務(wù)研究中心訊) 1月24日獲悉,“拍醫(yī)拍”宣布獲得了三千萬元A輪融資,并將產(chǎn)品發(fā)展方向正式從C端轉(zhuǎn)型到B端合作。
對于OCR(圖片文字識別)技術(shù),移動醫(yī)療并不是沒有人做,像杏樹林、珍立拍、易診肝病等都在進(jìn)行一定的嘗試??赡芎椭扔嘘P(guān),杏樹林受到的質(zhì)疑聲比較大,業(yè)內(nèi)人士表示,杏樹林在無錫有一個上百人的團(tuán)隊(duì)專門做信息的手動錄入??梢妶D文識別技術(shù)的重要性和實(shí)現(xiàn)的困難程度。
拍醫(yī)拍的核心團(tuán)隊(duì)成員都有很強(qiáng)的技術(shù)背景。創(chuàng)始人兼CEO吳施展是原來趕集網(wǎng)首席DBA、技術(shù)保障部總監(jiān),曾負(fù)責(zé)百度商業(yè)數(shù)據(jù)庫團(tuán)隊(duì),有十余年的大流量高負(fù)載互聯(lián)網(wǎng)開發(fā)及架構(gòu)經(jīng)驗(yàn),有豐富的大數(shù)據(jù)管理和挖掘經(jīng)驗(yàn);聯(lián)合創(chuàng)始人劉立是美國伊利諾伊理工學(xué)院博士,原天津大學(xué)信息工程副教授,計算機(jī)視覺與醫(yī)學(xué)影像專家,申請國內(nèi)外專利三十余項(xiàng),在醫(yī)學(xué)成像、醫(yī)學(xué)影像處理、圖像理解等方向有豐富研究與實(shí)踐經(jīng)驗(yàn)。
做圖文識別最強(qiáng)的要數(shù)百度,拍醫(yī)拍的聯(lián)合創(chuàng)始人楊瓊就是百度OCR和人工智能領(lǐng)域的重要負(fù)責(zé)人和推動者,也是百度最早推動深度學(xué)習(xí)進(jìn)行文字識別、圖片分類以及大數(shù)據(jù)分析的重要人物之一。楊瓊先后任職于微軟亞洲研究院、歐洲微電子中心、百度深度學(xué)習(xí)研究院,是文字識別、人臉識別、深度學(xué)習(xí)、人工智能、大數(shù)據(jù)分析等領(lǐng)域的資深專家,擁有11項(xiàng)世界或美國專利。
據(jù)億歐網(wǎng)了解,目前拍醫(yī)拍的技術(shù)團(tuán)隊(duì)主要是由楊瓊博士建立起來的。團(tuán)隊(duì)中也有醫(yī)療北京的創(chuàng)始人,拍醫(yī)拍的聯(lián)合創(chuàng)始人楊勁松從醫(yī)15年,是原云醫(yī)App的首席醫(yī)療官,也是好大夫在線第一任醫(yī)學(xué)總監(jiān)。
其實(shí)圖文識別技術(shù)和我們的生活非常貼近,最常見的應(yīng)用可能是名片的識別,拍醫(yī)拍的原理和它非常類似。但由于拍醫(yī)拍是專門應(yīng)用在醫(yī)療領(lǐng)域的,因此從技術(shù)的角度難度更大。
第一個難點(diǎn)是清晰度的問題。和名片不同,病歷的紙張較大,同樣拍下一張圖片,識別病歷的難度會更高。
第二的難點(diǎn)是醫(yī)學(xué)描述不統(tǒng)一,同樣一個信息在不同的醫(yī)院和科室可能有不同的表述方法,這很大程度上影響了信息的結(jié)構(gòu)化。技術(shù)能否實(shí)現(xiàn)對自然語言的理解和再學(xué)習(xí),是解決這一問題的難點(diǎn)。
第三個難點(diǎn)在于新技術(shù)的出現(xiàn)。隨著醫(yī)療的進(jìn)步,有越來越多的新技術(shù)可以對疾病進(jìn)行檢測,比如,近期火爆的基因檢測。而圖文識別能否對這些最新的檢測技術(shù)完成數(shù)據(jù)的結(jié)構(gòu)化采集,是這一類公司面臨的有一大技術(shù)性挑戰(zhàn)。
對此,吳施展對億歐網(wǎng)表示,拍醫(yī)拍的團(tuán)隊(duì)有能力應(yīng)對這些難點(diǎn)。目前,拍醫(yī)拍主要處理四種信息:廚房、化驗(yàn)單、檢查報告、住院病歷。從數(shù)據(jù)上看,拍醫(yī)拍識別常規(guī)化驗(yàn)單的準(zhǔn)確率超過90%。(來源:億歐網(wǎng))