地址:江苏省常州市武进区科教城常武中路801号现代工业中心1号楼2层 邮编:213164
技术支持:常州大学信息化建设与管理中心
基于CatBoost算法的长非编码RNA识别方法
发布时间: 2023-04-12 访问次数: 11
《基于CatBoost算法的长非编码RNA识别方法》
技术简介:
本发明涉及集成学习技术领域,尤其涉及基于CatBoost算法的长非编码RNA识别方法,包括:从数据库中获取包含若干个RNA序列的密码子相关特征、鸟嘌呤-胞嘧啶相关特征、转录本相关特征、序列结构相关特征、开放阅读框相关特征,并建立RNA序列特征向量;通过特征选择对RNA序列特征向量进行冗余特征过滤;对过滤后的RNA序列特征向量进行融合;将融合后的RNA序列特征向量送入CatBoost模型进行决策分类,根据概率分数判断为长非编码RNA或蛋白质编码RNA。本发明解决现有技术中长非编码RNA识别方法的不足之处,实现高准确率、高精确率、高马修斯相关系数、高效的长非编码RNA预测方法。
研发人员:杨森;王少聪;封红旗;朱轮