本发明属于生物信息领域,公开了一种癌症分类和特征基因选择方法,包括以下步骤:初级学习器的建立:建立T个logistic回归模型及其对应的sparse group lasso正则化的损失函数求解模型,输出次级学习器训练集;次级学习器的建立:建立multi-response回归模型及其对应L1正则化的损失函数求解模型,输出训练集预测结果;预后特征选择模型:建立预后特征选择SGL模型。本发明癌症分类和特征基因选择方法,满足预测、稳定和选择三大标准,stacking集成提高了模型对癌症分类预测的准确性和稳定性,准确选取致癌基因和癌症相关基因,增强模型的可解释性;融合基因与基因通路先验知识,提高了癌症分类的准确性和特征选择的有效性。