姐妹花 DNAVec:基因组DNA序列的预检修词向量暗示 DNAVec: Pre-Trained Word Vector Representation of Genomic DNA Sequences
2024-11-04西南交通大学生命科学与工程学院姐妹花,四川 成都 收稿日历:2021年4月23日;委用日历:2021年5月7日;发布日历:2021年6月1日 摘要 破译DNA序列所代表的信息是基因组磋磨的基本问题之一。基因调控编码由于存在多义性关系而变得稀奇复杂,而以往的生物信息学要津频频无法捕捉到DNA序列的隐含信息,尤其是在数据匮乏的情况下。因而从序列信息中预测DNA序列的结构和功能是策画生物学的一个挫折挑战。为了打法这一挑战,咱们引入了一种新的要津,通过使用当然话语处理界限的话语模子BERT将DNA序列