COMPUTEX Forum 2019
活动+
 

医疗人工智能四大区块 李友专:文字与编码让AI更有依据

台北医学大学医学科技学院院长李友专表示,现在医疗产业当中许多专注研发人工智能的团队,都致力于影像分析的研究,也因此人工智能辅助医疗影像判读的技术突破得很快。相较于这波影像判别热潮,李友专则说,台湾医疗人工智能创新研究中心(AIMHI)定位不同,因此关注焦点是放在另外3大类别,分别是文字描述、生理数据讯号、编码资料。

医疗文字叙述让AI更聪明

 点击图片放大观看

李友专认为,编码资料将会是台湾人工智能发展很有利基的资源。AIMHI提供

李友专说,在文字叙述当中,资料又分成两大类。第一大类包含了门诊的SOAP资料和病历,以及入、住、出院的行政内容与急诊的叙述文字。第二大类则包括了美国国家医学图书馆(National Library of Medicine;NLM)的MEDLINE资料库,以及PubMed等资料库平台当中、2,000多篇以上的文献摘要内容。其中在台湾又以万芳医院有使用的IBM Watson for Oncology系统为第二大类中最好的例子。

李友专认为,文字叙述所影响的科别也是最多的。在医院的文字叙述当中,所谓的SOAP资料,指的是:

.S (Subjective data):主观自觉征候,包括病人主诉、症状、发病时间、现在、过去、个人病史。

.O (Objective data):医疗人员的客观检查结果,包含了诊察发现与各种检查报告。

.A ( Assessment ):医疗人员的诊断评估,也就是诊断(diagnosis)或臆断(impression)。

.P ( Plan ):治疗计划,象是处置、医令、处方。

李友专说,这些资料就涵括超过10万个变项。此外他也提醒,抽血等「检查」与「检查科」是不相同的领域。检查科当中包含了放射科学、病理学、核子医学等等面向,这都汇聚了许多自由文字(Free Text)。

生理数据讯号喂养人工智能

由于现代软硬件科技进步,能够收集到的样本数,已经不仅几百万笔而已,而是往往都数以亿计。而这些偶尔反而过于「丰富」的数据,很容易让研究人员难以判断。在临床判断上来说,其实不是很实用。该如何在去芜存菁的过程中,可以有效掌握关键数据,将是未来各界智能医疗发展可以切入的角度。

此外,心电图(ECG)、肌电图(EMG)、由呼吸器所收集到的数据、心跳、血压这些生理数值,都是连续性的纪录。透过收集长时间的数据,也就可以找出动态变化。李友专也分享,过往一般心电图量测时间,大约只有5-15分钟,现在透过一些改良过的霍特式行动心电图机器(Holter),已经可以达到24小时的量测功效。

除了台湾以外,李友专提到,包括了麻省理工学院(MIT)、哈佛、波士顿贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center;BIDMC)都有在收集与分析大数据库。其中,各大加护病房当中的心电图数据,就已有超过20万人的资料可供研究。

编码资料让人工智能有标准依据

医疗信息编码很重要,但李友专提醒,拥有良好编码系统的国家其实并不多。台湾或许可以积极利用累积了23年的健保资料,进而在文字叙述统计、预测死亡率、辅助医师诊断等方向,提供更多应用内容。

李友专说,与影像的分析概念也相当类似,数据也要用多维和多面向的方式来检验与分析。举例来说,2000x2000这样400万个点的X光片,也就等于有400万个变量需要分析。也因此系统性的编码资料在未来的智能医疗产业应用上,变得十分关键。

现职

台北医学大学医学科技学院院长

台北医学大学医学信息研究所特聘教授

台北医学大学市立万芳医院皮肤科主任

社团法人台湾远距照护服务产业联盟理事

国际SCI期刊全球总编辑

《International Journal for Quality in Health Care》

《Journal of Computer Methods and Programs in Biomedicine》

学历

1994年-美国犹他大学医学信息博士

1991年-台北医学大学医学士

荣誉

2017国际健康信息学院(IAHSI)创始院士

2015中华民国信息产业最高桂冠-杰出信息人才奖

2010美国医学信息学院(ACMI)院士

2010澳洲医学信息学院(ACHI)院士

2001中华民国十大杰出青年

经历

台湾医学信息学会荣誉理事长

台北医学大学副校长

国立阳明大学生物医学信息研究所教授兼所长

亚太医学信息学会(APAMI)主席

台北市立万芳医院医疗信息副院长

台北医学大学医学信息研究所教授兼所长

  •     按赞加入DIGITIMES智能医疗粉丝团