基于CatBoost算法的长非编码RNA识别方法

   发布时间: 2023-04-12    访问次数: 11

《基于CatBoost算法的长非编码RNA识别方法》

技术简介:

本发明涉及集成学习技术领域,尤其涉及基于CatBoost算法的长非编码RNA识别方法,包括:从数据库中获取包含若干个RNA序列的密码子相关特征、鸟嘌呤-胞嘧啶相关特征、转录本相关特征、序列结构相关特征、开放阅读框相关特征,并建立RNA序列特征向量;通过特征选择对RNA序列特征向量进行冗余特征过滤;对过滤后的RNA序列特征向量进行融合;将融合后的RNA序列特征向量送入CatBoost模型进行决策分类,根据概率分数判断为长非编码RNA或蛋白质编码RNA。本发明解决现有技术中长非编码RNA识别方法的不足之处,实现高准确率、高精确率、高马修斯相关系数、高效的长非编码RNA预测方法。


研发人员:杨森;王少聪;封红旗;朱轮