收藏本站

基于DNA序列的无损压缩算法研究

【摘要】:随着信息技术的发展,越来越多的数据被人们所记录用于开展各种工作与活动。在生物信息领域,DNA作为生物体内储存着大量生物遗传信息的遗传物质,对生物生命机能产生了重要的作用。在DNA测序技术和其他各类测序技术的影响下,DNA序列数据也急速增长,数据量增长速度呈指数方式。如何利用有限的储存空间,有效地保存大量有研究作用的DNA序列数据,是现今DNA研究相关领域学者所面临的新课题。然而,传统的数据压缩算法对DNA序列的压缩结果并不理想,甚至可能导致存储空间膨胀。DNA序列内部特殊的重复结构,如直接重复,镜像重复,互补回文等,以及不同物种或相同物种不同个体DNA序列间的高度重复性,使得DNA序列的结构化压缩成为可能。本文主要研究如何利用更有效的压缩方法以减少数据的存储空间。针对有参考序列的DNA序列压缩,本文结合字典编码与统计编码的优势,提出了一种有效的DNA序列压缩方法——基于全文索引的互补上下文压缩算法。在压缩第一阶段,该方法利用高效索引结构FM-index查找并定位参考序列中的最长匹配序列,由于FM-index结构通常用于固定长度图案匹配,不利于对实际序列的匹配和记录信息,改进后的FM-index可以在有限时间内对可变长度序列进行查找与定位。为了在解码端无损恢复出输入序列,对于第一阶段未匹配的符号,本文利用互补上下文模型,根据不同的上下文模型计算符号出现概率,并结合连续上下文与非连续上下文模型计算出预测概率进行算术编码,从而实现高效的序列无损压缩。实验证明该方法对未经预处理的序列在压缩率上超过其他DNA压缩算法。针对无参考序列的DNA序列压缩,本文提出了一种基于自编码器的序列预测与压缩模型。利用卷积层结构学习数据的特征表示,通过自编码器编码部分得到序列的稀疏表示单元,并将该表示作为压缩编码的一部分。将得到的表示单元输入到解码部分重构输入序列。为了达到序列无损压缩的目的,将重构序列与输入序列间残差记录并编码压缩,作为压缩编码的另一部分。本文探索了利用深度学习技术实现序列无损压缩的可能性,通过网络学习到序列隐含的特征。实验证明本文提出的卷积自编码器模型对人类基因组DNA序列的重构准确率高达98%以上,压缩率达到4.78%,实现了比传统算法更高的压缩率。

下载App查看全文

(如何获取全文? 欢迎:、、)

支持CAJ、PDF文件格式


【相似文献】
中国期刊全文数据库 前10条
1 刘敏;;基于科学思维的“DNA是主要的遗传物质”教学设计[J];教育观察;2019年30期
2 刘涛;;关于几种植物材料DNA含量差异性的研究[J];中学生物学;2019年03期
3 陈从周;;DNA折纸术——全编程的信息工具[J];广州大学学报(自然科学版);2019年01期
4 Jiaojiao Zhang;Feng Li;Dayong Yang;;DNA: From Carrier of Genetic Information to Polymeric Materials[J];Transactions of Tianjin University;2019年04期
5 赵海燕;石晓龙;;DNA Tile 计算简述[J];广州大学学报(自然科学版);2019年02期
6 王豆;许冠;王洪永;何森;卜书海;郑雪莉;;中国圈养林麝微卫星DNA多样性研究[J];兽类学报;2019年06期
7 王若湛;;探讨DNA鉴定技术在法医物证学中的应用[J];世界最新医学信息文摘;2019年85期
8 李文送;;DNA甲基化及其生物学功能[J];生物学教学;2014年09期
9 刘庆华;茹慧香;;“DNA是主要的遗传物质”教学设计[J];中学生物教学;2016年07期
10 丁思思;袁华;罗小虎;李高峰;;植物DNA粗提取与鉴定的简便方法[J];中学生物教学;2016年19期
中国重要会议论文全文数据库 前10条
1 刘冰;王旭;赵梦真;晁洁;樊春海;;基于DNA折纸术的纳米金棒精密修饰[A];中国化学会第30届学术年会摘要集-第二十八分会:化学生物学[C];2016年
2 刘冬生;李闯;程恩隽;邢永政;金娟;;DNA超分子水凝胶及其应用[A];中国化学会第30届学术年会摘要集-第二十四分会:超分子组装与软物质材料[C];2016年
3 Kaiying Cheng;Hong Xu;Xuanyi Chen;Liangyan Wang;Bing Tian;Ye Zhao;Yuejin Hua;;Structural basis for DNA 5′-end resection by RecJ[A];第五届中国结构生物学学术讨论会摘要集[C];2016年
4 陈南迪;覃诗雅;羊小海;王青;翦立新;王柯敏;;“传感-治疗”的DNA纳米装置在协同杀伤循环肿瘤细胞的应用[A];中国化学会第30届学术年会摘要集-第三十八分会:纳米生物效应与纳米药物化学[C];2016年
5 刘晔华;陈锦艳;江雁;张坚磊;穆红;;磁珠法提取金黄色葡萄球菌基因组DNA的评价[A];第七届中国临床微生物学大会暨微生物学与免疫学论坛论文汇编[C];2016年
6 谭磊;孙悦;周湘;刘伟;;多头蚴核糖体DNA及线粒体DNA多态性研究[A];中国畜牧兽医学会兽医寄生虫学分会第十三次学术研讨会论文集[C];2015年
7 叶俏;沈洁;严婷婷;王宙政;;原发性干燥综合征患者血浆循环DNA与疾病活动相关性研究[A];2015年浙江省风湿病学学术年会论文汇编[C];2015年
8 周嘉嘉;FriederikeSchmid;;计算模拟研究DNA和聚电解质的结合[A];2015年全国高分子学术论文报告会论文摘要集——主题E 高分子理论计算模拟[C];2015年
9 Yuan Zhang;Yanlong Chen;Gaigai Xu;Chen Lan;Shaige Xia;Wenjie Zhao;Shusheng Zhang;;Endogenous DNA adducts method establishment and Human Biomonitoring[A];河南省化学会2016年学术年会论文摘要集[C];2016年
10 孙觅;辛丽斐;刘宏;;基于浓差电池原理高灵敏检测DNA的传感器[A];中国化学会第30届学术年会摘要集-第四分会:生物分析和生物传感[C];2016年
中国博士学位论文全文数据库 前10条
1 刘雨双;基于DNA链置换反应动力学和GFET对DNA甲基化的检测[D];内蒙古农业大学;2019年
2 张保柱;DNA适体基荧光金属纳米簇对金属离子及生物分子的turn-on检测[D];山西大学;2019年
3 李锦;基于螺吡喃分子开关的G—四链体DNA荧光探针的构建与应用研究[D];西北大学;2019年
4 于秋彦;DNA诱导的纳米粒子自组装的分子动力学模拟及嵌段共聚物的自洽场理论模拟研究[D];南京大学;2019年
5 王路;利用DNA条形码与形态相结合的方法对亚历山大塔玛复合种和夜光藻的内共生绿藻进行系统分类学研究[D];厦门大学;2017年
6 郑心如;DNA双链断裂修复调控蛋白筛选及调控机制研究[D];厦门大学;2017年
7 郑涛;DNA磷硫酰化修饰蛋白DndEi的功能和磷硫酰化修饰频率的研究[D];上海交通大学;2017年
8 郭斌;基于DNA自组装纳米结构的生物传感新方法研究[D];重庆医科大学;2019年
9 周晓燕;基于功能性DNA纳米结构的等温扩增检测方法研究[D];重庆医科大学;2019年
10 李新;载多柔吡星DNA自组装纳米折纸对人卵巢癌靶向治疗的实验研究[D];武汉大学;2016年
中国硕士学位论文全文数据库 前10条
1 康佳鑫;DNA序列表示及相似性比较[D];哈尔滨师范大学;2019年
2 谷璐婷;裂殖酵母Clr1蛋白在DNA损伤应答中的分子机制探究[D];重庆医科大学;2019年
3 晏小玉;基于链置换扩增和DNA酶的HIV相关基因荧光传感检测新方法研究[D];重庆医科大学;2019年
4 杨珍琴;DNA计算模型在NP-完全问题中的应用[D];安徽理工大学;2019年
5 常凡;基于新型二维碳材料石墨炔检测结核分枝杆菌及其耐药基因的一步式DNA荧光传感策略[D];重庆医科大学;2019年
6 杨盛慧;NTHi-DNA诱导的IFN-I上调宿主炎性应答及对不可分型流感嗜血杆菌易感性影响的初步研究[D];重庆医科大学;2019年
7 马洪敏;基于3D DNA Walker和ESDR检测BRCA1的荧光新方法研究[D];重庆医科大学;2019年
8 袁长婧;高度整合熵驱动与酶切反应构建双层三维DNA步行传感器用于HIV的检测[D];重庆医科大学;2019年
9 王棒;氧化还原刺激响应DNA动态自组装及DNA辅助金纳米粒子构象可控结构制备[D];合肥工业大学;2019年
10 吴昌云;基于DNA甲基转移酶为靶点的小分子化合物的设计与合成研究[D];贵州大学;2015年
中国重要报纸全文数据库 前10条
1 亚尼弗·埃利奇 本报记者 沈春蕾 整理;[N];中国科学报;2020年
2 黄辛;[N];科学时报;2011年
3 本报记者 辛明;[N];中国青年报;2011年
4 本报记者 欧阳晓红 韩宋辉;[N];经济观察报;2015年
5 深圳特区报首席记者 孙锦;[N];深圳特区报;2018年
6 记者 冯卫东;[N];科技日报;2018年
7 本报记者 李禾;[N];科技日报;2019年
8 记者 刘霞;[N];科技日报;2019年
9 任芳言;[N];中国科学报;2019年
10 记者 冯卫东;[N];科技日报;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978


{bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bcksports}| {bck体育下载}| {bckbet}| {bcksports}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bck官网}| {bck体育下载}| {bckbet}| {bcksports}| {bck官网}| {bck体育app}| {bck体育}| {bcksports}| {bck官网}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck官网}| {bck体育}| {bcksports}| {bck官网}| {bck体育官网}| {bck体育下载}| {bck体育}| {bckbet}| {bcksports}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bck体育}| {bckbet}| {bck官网}| {bck}| {bck体育官网}| {bck体育下载}| {bck体育app}| {bcksports}| {bck官网}| {bck}| {bck体育官网}| {bcksports}| {bck体育下载}| {bck体育app}| {bckbet}|
{uc8}| {uc8体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐城}| {uc8彩票}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {uc8体育}| {UC体育}| {uc8老虎机}| {uc8老虎机}| {UC8娱乐}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8老虎机}| {uc8彩票}| {uc8}| {uc8体育}| {UC体育}| {uc8官网}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {uc8彩票}| {uc8}| {uc体育}| {UC体育}| {UC8娱乐城}| {uc8}| {UC体育}| {uc8官网}| {uc8老虎机}| {uc8}| {uc体育}| {uc8体育}| {UC体育}| {uc8官网}| {uc8老虎机}| {UC8娱乐}| {UC8娱乐城}|