最近的思考
医疗数据要素的价值非常高,但是存在的难点是:
1. 算法训练需要人工打标签,医疗必须医疗专家才能操作,所以开放医疗数据,建设医疗大模型,对人类的健康发展至关重要。
2. 文本语义大模型可以搞定医疗诊断,但是B超,X光片的 图像识别做不到,所以需要多模态。
3. 医疗数据很敏感,隐私保护至关重,法规伦理流通障碍导致了信息孤岛。
解决思路
01
多模态大模型
meta 的 SAM 和 商汤的日日新大模型,且开源; 是多模态大模型(算法)发展的转折点。
1)大幅降低了图像识别的技术门槛,不再需要此前需要大量人工数据标注训练的门槛。
2)开源后使得没有计算机视觉技术积累的公司,也能轻易拥有最强大最通用的图像数据结构化理解能力,是多模态的关键一步.
02
数据安全
隐私保护计算框架:①原始数据不出域,可用不可见(安全保证了);②数据不动模型动”,不共享数据,而是共享数据价值(数据确权);③数据使用可控可计量(法律合规)
可以买什么?
1. 多模态大模型,CV图像的应用 ,软硬件公司;
2. 医疗公共数据开放,能介入这个领域的公司;
3. 数据安全保护的公司,特别是业务涉及了隐私保护计算,政务,金融必备;
4. 医疗智能化+生物制药,AI+医疗数据加速生物制药的研发生产流程,且整个板块调整了一年多,尚在低位。
5. AI三要数:算法+算力+数据, 拥有数据的公司,特别是公共数据的运营可以得到政策支持,数据参与交易所场内相关公司。
建议关注浙江和上海
(个人的总结,全国看北京,北京看浙江,浙江看浙国资委,在杭州有华为和阿里技术加持。)