收藏本站

主题模型及其在中医临床诊疗中的应用研究

【摘要】:主题模型(Topic Model)能够提取隐含在文档(或其它离散数据集)中的主题,其中每个主题是语义相关的词上的多项式分布。主题模型的主要目的是提取数据集中隐含的统计规律且利用主题进行直观表达,然后可以利用获得的主题进行信息检索、分类、聚类、摘要提取以及进行信息间相似性、相关性判断等一系列应用。近年来,主题模型已逐渐成为文本挖掘、信息检索等领域的一个新的研究方向。 中国传统医学(简称中医)作为传统生命科学的一个重要组成部分,在疾病诊疗方面具有特色和显著的临床疗效。几千年的中医诊疗实践积累了大量的临床数据,这些数据中包含着丰富的符合中医理论的知识与规律。在中医信息化建设的背景下,利用现代化手段挖掘隐藏在这些临床数据中的中医诊疗规律具有重要意义。随着数据挖掘技术的逐渐成熟和广泛应用,利用数据挖掘等手段,分析挖掘中医诊疗规律已逐渐成为国内中医理论研究热点。近年来,研究人员应用聚类分析、关联规则以及回归分析和判别分析等方法研究中医理论,并已取得了一定的研究进展,但是,仍然难以体现中医的语义复杂性特点以及中医诊疗的系统性特点。 本文首次尝试把主题模型引入中医临床诊疗规律的研究中。使用主题模型的动机是我们不仅认为主题模型能够捕获中医临床诊疗数据集中的语义特征,而且认为主题模型中的主题推理及生成过程与《伤寒论》所述的“观其脉症,知犯何逆,随证治之”的中医辨证论治过程基本一致,都是由显变量到隐变量再到显变量的过程。本文利用主题模型分析了2型糖尿病、冠心病的临床诊疗数据以及中医文献数据。实验表明,利用主题模型能够提取出有临床意义的中医诊疗规律,为中医临床研究提供一种新颖的理论方法,为中医临床辨证治疗提供一种客观依据。 本文的主要工作如下: (1)以隐狄利克雷分配(Latent Dirichlet Allocation, LDA)模型为代表的主题模型,是近年来文本挖掘和信息检索等领域的一个新的研究热点。本文系统地对主题模型的产生背景、发展过程、LDA主题模型常用的推理方法以及典型的主题模型进行归纳总结。为本文的研究奠定基础,为相关研究人员在主题模型领域的应用研究提供较系统的参考依据。 (2)提出LDA主题模型的特征加权机制。我们直接采用LDA主题模型分析中医临床症状主题时,发现主题分布向高频词倾斜,能够代表主题特征的词被少量的高频词淹没,导致主题的解释性和区分性不佳,而且在建模过程中影响其它词在主题上的合理分配。于是,针对标准文本数据,采用倒排文档频率(Inverse Document Frequency, IDF)进行特征加权;针对中医临床数据,提出一种新颖的高斯函数特征加权方法。实验表明:加权LDA主题模型能够提高主题间的区分能力、提高主题的可解释性以及提高主题模型的建模速度;在Newsgroups标准数据集上,利用建模后的主题作为特征进行支持向量机(Support Vector Machine, SVM)分类时,能够提高分类准确率(Accuracy);能够在一定条件下,降低模型的困惑度/复杂度(Perplexity)。 (3)针对LDA主题模型不能自动确定主题数目的问题,提出一种结合词相似性与中国餐馆过程(Chinese Restaurant Process, CRP)的主题模型;同时,针对LDA主题模型的Gibbs抽样近似推理中的两个Dirichlet超参数难以合理设置的问题,提出一种新颖的超参数设置方法。实验表明:提出的模型可以自适应地动态更新主题内容,确定合理的主题数目;超参数的设置能够方便灵活地适应不同的数据集,取得较低的模型复杂度。 (4)分析主题模型和中医辨证论治的联系,在LDA模型和作者-主题模型的基础上,提出一种症状-中药-诊断主题模型,用于自动提取中医临床数据中症状、中药和诊断间的主题结构,系统地探索具有临床意义的多个实体间的关系。在2型糖尿病临床数据的分析实验中,获得了2型糖尿病典型的并发症/合并病(如糖尿病合并肾病,糖尿病外围神经病变等)的诊疗主题结构。实验结果分析表明:一类症状或其组合仅为人群/疾病分类找到了一种划分方式或依据,并不等同于该症状组合就对应唯一的证候或诊断,中医存在个性化诊疗特点;同时中医也存在共性的诊疗规律;提出的症状-中药-诊断主题模型能较好地揭示疾病的症状和中药分布特征以及中医诊疗规律。 (5)对于一种复杂疾病(如糖尿病),通常存在多种并发症。于是,体现出的症状存在疾病主症和伴随症状间的层次关系;同时,用药也存在相应的分层关系,即对方剂进行随症加减。针对上述情况,为了揭示症状及相应用药的层次关系,本文在分层LDA模型和连接LDA模型的基础上,提出一种分层症状-中药主题模型。该模型在糖尿病临床数据的实验中,发现了有临床意义的症状分层结构和对应的用药分层规律。为探索中医临床诊疗中的方剂随症加减规律提供一种新颖的统计方法。

下载App查看全文

(如何获取全文? 欢迎:、、)

支持CAJ、PDF文件格式


【相似文献】
中国期刊全文数据库 前20条
1 娄钰华;李生校;;高校危机管理策论——一个模型分析[J];中国高等医学教育;2006年09期
2 刘汝平;宋晶;张丽媛;;磨牙远移治疗中一种新的模型分析法的建立与应用[J];现代中西医结合杂志;2010年33期
3 刘红彦,吴海燕;发育期腭开展后骨骼及牙齿变化的分析[J];中国现代医学杂志;2005年20期
4 刘汝平;孙丽萍;宋晶;乌兰其其格;;上颌磨牙远移治疗中模型和X线片评价的差异性研究[J];现代中西医结合杂志;2009年33期
5 刘文苗;杨雪;王丽;吴春雨;;基于Maya技术的医学虚拟实验模型构建[J];实验技术与管理;2011年04期
6 吕超贤,孙莹玉,王晓霞;Ⅱ类Ⅰ分类错患者不拔牙矫治的疗效评价[J];中日友好医院学报;2005年04期
7 张达;胡敏;王芳;相亚宁;;安氏Ⅱ、Ⅲ类错畸形治疗后咬合关系与牙量比例的相关性研究[J];现代口腔医学杂志;2008年06期
8 陈仕检;毕桂南;石胜良;;啮齿动物类大鼠局灶性脑缺血模型分析[J];内科;2009年06期
9 冯兴梅;倪桂凤;沈小波;张健;姚淑萍;;X线头影测量不调值对口腔正畸诊断的影响[J];交通医学;2007年06期
10 陈芷若;;脑血管疾病的远期预后—危险比例的模型分析[J];国际脑血管病杂志;1993年02期
11 朱航宇*;顾海#;;用ELES模型分析城镇居民药品需求弹性[J];中国药房;2006年09期
12 周东浩;侯沉;;基于营卫倾移的证解释模型的构建[J];中华中医药杂志;2007年03期
13 张耀明;彭广福;宋越;高焱明;;胆囊癌术后COX模型预后分析[J];肝胆外科杂志;2009年05期
14 吴风波;;温泉居民HBsAg年龄阳性率的催化模型分析[J];中国公共卫生;1990年08期
15 ;外科治疗学[J];国外科技资料目录(医药卫生);1997年07期
16 庞光明;AngleⅡ/1错牙合治疗前后和保持后的模型分析研究[J];口腔医学研究;2004年02期
17 黄琰;高义军;;第一前磨牙3个根管1例[J];牙体牙髓牙周病学杂志;2005年12期
18 俞昳丽;唐国华;龚方方;陈林玲;钱玉芬;;快速扩弓和Damon技术非拔牙矫治牙列拥挤的比较研究[J];上海口腔医学;2008年03期
19 赵贵宁;;基于SWOT模型分析西部地区康复医疗机构发展特殊性战略[J];医学信息(中旬刊);2011年06期
20 王秀,王鑫,薛家芹;试用余弦曲线模型分析流行性出血热发病时间[J];中华预防医学杂志;1995年03期
中国重要会议论文全文数据库 前10条
1 王季槐;M.J.Kropff;B.,Lammert;S.,Christensen;P.K.Hansen;;应用细胞自动机(CA)模型研究植物种群在可控制系统中的扩散机制:一年生杂草作为一个应用实例(英文)[A];贵州省自然科学优秀学术论文集[C];2005年
2 钱林晓;;个人人力资本投资决策的简化理论模型[A];2007年中国教育经济学年会会议论文集[C];2007年
3 王玲;赵妍;;基于Fishbein理性行为模型分析上海消费者美洲旅游行为影响因素[A];区域旅游:创新与转型——第十四届全国区域旅游开发学术研讨会暨第二届海南国际旅游岛大论坛论文集[C];2009年
4 毛曹珏;曹锐;;两种缺陷接地结构的模型分析[A];2007年全国微波毫米波会议论文集(下册)[C];2007年
5 肖建春;聂建国;马克俭;;桁拱支承索网结构模型的破坏试验[A];第三届全国现代结构工程学术研讨会论文集[C];2003年
6 李云梅;王秀珍;;用模型分析的方法探讨水稻冠层结构变化对冠层反射光谱的影响[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
7 钱林晓;王一涛;;对应试教育条件下学生学习行为的模型分析[A];2005年中国教育经济学年会会议论文集[C];2005年
8 侯文峻;张建民;张嘎;;三板溪面板堆石坝应力变形的数值模拟[A];第二届全国岩土与工程学术大会论文集(上册)[C];2006年
9 赵雪松;杜荣;朱晓燕;;师徒模式下的知识共享效用模型分析[A];提高全民科学素质、建设创新型国家——2006中国科协年会论文集[C];2006年
10 陈银飞;;2000~2009年世界贸易关系的块模型分析[A];江苏省外国经济学说研究会2011年学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 张小平;主题模型及其在中医临床诊疗中的应用研究[D];北京交通大学;2011年
2 孙元;基于任务—技术匹配理论视角的整合性技术接受模型发展研究[D];浙江大学;2010年
3 赵顶位;中小学生几何类比推理能力诊断评价中的理论与技术研究[D];江西师范大学;2011年
4 史倩倩;二维强关联电子系统的gPEPS算法与二维t-J模型的基态相图[D];重庆大学;2012年
5 傅霞萍;水果内部品质可见/近红外光谱无损检测方法的实验研究[D];浙江大学;2008年
6 谭利;复杂网络模型及应用研究[D];中南大学;2010年
7 杨业兵;两级评分自陈式量表项目反应理论分析的方法与模型选择[D];第四军医大学;2011年
8 赵宏旭;波动方程的高斯过程模型分析及在晶圆切割中的应用研究[D];清华大学;2010年
9 陈普;FAVAR及其时变模型在中国宏观经济的应用[D];华中科技大学;2012年
10 车少辉;基于神经网络方法的杉木人工林林分生长模拟研究[D];中国林业科学研究院;2012年
中国硕士学位论文全文数据库 前10条
1 喻珠峰;基于LT模型的上市公司信用风险度量和管理研究[D];哈尔滨工业大学;2010年
2 柴莎莎;基于PSR模型安康市全球变化适应度评价[D];陕西师范大学;2011年
3 杜军;山东半岛城市群模型分析方法研究[D];山东师范大学;2007年
4 张达;应用模型测量及PAR指数测量研究安氏Ⅱ类、Ⅲ类错(牙合)畸形治疗后咬合关系[D];吉林大学;2008年
5 张存涛;中国城镇养老保险体系转轨成本的经济学分析[D];复旦大学;2008年
6 姚媛;房地产市场调研在项目前期定位中的实证研究[D];华中师范大学;2009年
7 张松磊;基于CGE模型的煤价—电价波动影响研究[D];华北电力大学(北京);2010年
8 刘勃;股指期货套期保值绩效实证分析[D];天津财经大学;2008年
9 杨绍创;信用风险度量方法及KMV模型的实证[D];华南理工大学;2010年
10 桂司文;基于KMV模型的我国上市公司信用风险度量的实证研究[D];中国科学技术大学;2010年
中国重要报纸全文数据库 前10条
1 江苏省昆山市地税局;[N];中国税务报;2010年
2 媛萍;[N];中国高新技术产业导报;2002年
3 白爱仙;[N];财会信报;2011年
4 特约撰稿 王芳;[N];云南经济日报;2010年
5 记者  冯海波;[N];广东科技报;2006年
6 刘文杰 中南财经政法大学;[N];中国社会科学报;2010年
7 范超;[N];中国信息报;2011年
8 东北财经大学 张向达 李宏;[N];光明日报;2009年
9 东北证券策略分析师 郭峰;[N];上海证券报;2007年
10 李岭涛;[N];中华新闻报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978


{bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck体育下载}| {bckbet}| {bcksports}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bck官网}| {bck体育下载}| {bckbet}| {bcksports}| {bck官网}| {bck体育app}| {bck体育}| {bcksports}| {bck官网}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck体育}| {bcksports}| {bck官网}| {bck体育官网}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bck官网}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bcksports}| {bck官网}| {bck}| {bck体育官网}| {bcksports}| {bck体育下载}| {bck体育app}| {bckbet}|
{uc8}| {uc8体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐城}| {uc8彩票}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {uc8体育}| {UC体育}| {uc8老虎机}| {uc8老虎机}| {UC8娱乐}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8老虎机}| {uc8彩票}| {uc8}| {uc8体育}| {UC体育}| {uc8官网}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {uc8彩票}| {uc8}| {uc体育}| {UC体育}| {UC8娱乐城}| {uc8}| {UC体育}| {uc8官网}| {uc8老虎机}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}|