个人信息

工作经历

平安科技 ( 2018年1月 ~ 至今 )

电子病历结构化

我在该项目中负责命名实体识别、关系抽取以及知识图谱实体链接。设计和实现了基于bi-lstm+crf的命名实体识别算法,可有效识别出疾病和诊断、症状和体征、检查和检验、手术、药品、身体部位等命名实体,f1分数可达到0.9。设计和实现了基于知识图谱的实体链接算法,利用了字向量、词向量、最长公共子序列以及实体的属性等信息,将非标准化的实体名对应到知识图谱中的标准化术语。

ICD智能编码

我负责整个项目的前期调研、统筹规划、算法设计和实现以及前端工具的开发,在整个项目的过程中起到了核心的作用。创新地提出了基于层级的算法,用到了卷积神经网络和注意力机制,很好地实现了对给定的诊断描述进行自动ICD编码的任务,对比基准模型f1分数、hit@1和hit@5均提高10%左右。基于该模型,我用Vue开发了一套前端可视化的工具,实现了输入文字或者上传文件自动进行编码并展示出模型输出的概率前5的编码信息。

教育背景

爱丁堡大学(2016.9-2017.9)

利物浦大学(2014.9-2016.6)

西交利物浦大学(2012.9-2014.6)

技能清单

以下均为我熟练使用的技能
- 编程语言:Python/JavaScript/R/Java
- 机器学习 :Pytorch/Tensorflow/Numpy/Pandas
- 前端框架:Vue
- 数据库相关:MySQL/PgSQL
- 服务器相关:Nginx/Linux命令
- 版本管理:Git