• 国家药监局综合司 国家卫生健康委办公厅
  • 国家药监局综合司 国家卫生健康委办公厅

基于本地大模型的骨质疏松专病数据库构建流程优化研究

通讯作者: 周毅, zhouyi@mail.sysu.edu.cn
DOI:10.12201/bmr.202410.00002
声明:预印本系统所发表的论文仅用于最新科研成果的交流与共享,未经同行评议,因此不建议直接应用于指导临床实践。

Research on optimization of osteoporosis disease database construction process based on local large model

Corresponding author: zhouyi, zhouyi@mail.sysu.edu.cn
  • 摘要:目的 利用本地大模型结合本地知识库优化骨质疏松专病数据库构建流程,减小医疗数据泄露风险。方法 首先收集相关临床研究文献和业务数据信息并构建本地知识库,然后基于本地化大模型应用架构,使用本地知识库和指标平台对本地大模型进行提示工程,最后,基于本地化大模型应用架构图形问答界面和编程接口,通过自然语言问询和编程方式,引导本地大模型生成骨质疏松专病数据库字段集和数据生产。结果 本地化大模型结合本地知识库,可以总结骨质疏松既往研究中涉及的字段,有效提高骨质疏松专病数据库构建效率和质量,但处理结果需要人工核查。同时基于本地大模型可以实现多模态数据的本地化处理,减小医疗数据泄露风险。

    关键词: 专病数据库;大模型;本地化部署;自然语言理解;非结构化数据处理

     

    Abstract: Objective Utilize local large models combined with local knowledge base to optimize the osteoporosis disease database construction process and reduce the risk of medical data leakage. Methods First, relevant clinical research literature and business data information are collected and a local knowledge base is built. Then, based on the localized big model application architecture, the local knowledge base and indicator platform are used to perform prompt engineering on the local big model. Finally, based on the graphical question-and-answer interface and programming interface of the localized big model application architecture, natural language queries and programming methods are used to guide the local big model to generate osteoporosis disease database field sets and data production. Results The localized large model combined with the local knowledge base can summarize the fields involved in previous osteoporosis research and effectively improve the efficiency and quality of building a database for osteoporosis, but the processing results need to be manually verified. At the same time, based on the local large model, the local processing of multimodal data can be achieved, reducing the risk of medical data leakage.

    Key words: Disease-specific database; large model; local deployment; natural language understanding; unstructured data processing

    提交时间:2024-10-03

    版权声明:作者本人独立拥有该论文的版权,预印本系统仅拥有论文的永久保存权利。任何人未经允许不得重复使用。
  • 图表

  • 张亚男. 基于NLP构建病历后结构化专病数据库的探索和实践. 2024. doi: 10.12201/bmr.202406.00007

    连万民. 基于数据治理的脑血管专病数据库建设实践. 2022. doi: 10.12201/bmr.202210.00011

    龙思哲, 张敦明, 吴震天, 黎鹏安, 王毅, 周毅, 张武军. 基于数据治理的专病数据库建设实践. 2022. doi: 10.12201/bmr.202207.00012

    刘迷迷, 杜国霞, 周毅, 吴斌, 吴晓瑛. 肝硬化专病数据库建设与应用研究. 2021. doi: 10.12201/bmr.202104.00014

    车贺宾, 徐洪丽. 构建医学大数据应用实践中临床数据处理流程规范. 2021. doi: 10.12201/bmr.202109.00002

    吕婷钰, 李晓瑛, 刘宇炀, 杜晋华, 李心怡, 罗妍, 唐小利, 任慧玲, 刘辉, 尹浩. 中文医学知识大模型问答语料数据集构建研究. 2024. doi: 10.12201/bmr.202404.00002

    张百平. 从EMR系统关系数据库构建患者诊疗图谱. 2021. doi: 10.12201/bmr.202110.00031

    余莎莎, 李汉民, 肖辉. 医院信息系统数据库云平台及零数据丢失建设实践. 2021. doi: 10.12201/bmr.202110.00028

    施呈昊, 屠馨怡, 史佳伟, 陈红爽, 王琴潞, 邹海欧. 大语言模型在临床实践中应用的范围综述. 2024. doi: 10.12201/bmr.202406.00001

    周磊. 基于PDCA构建专病模板为导向的CAP患者 病情严重程度评估体系. 2024. doi: 10.12201/bmr.202409.00064

  • 序号 提交日期 编号 操作
    2 2024-07-08

    bmr.202410.00002V2

    下载
    1 2024-07-08

    bmr.202410.00002V1

    下载
  • 公开评论  匿名评论  仅发给作者

引用格式

王耀国, 唐诗诗, 刘泓泽, 安雨婷, 周毅. 基于本地大模型的骨质疏松专病数据库构建流程优化研究. 2024. biomedRxiv.202410.00002

访问统计

  • 阅读量:45
  • 下载量: 0
  • 评论数:0

Email This Article

User name:
Email:*请输入正确邮箱
Code:*验证码错误