进口 numpy公司
从 杏子 进口 设施位置选择
X(X) = numpy公司 . 随机的,随机的 . 正常的 ( 100 , 1 , 大小 = ( 5000 , 25 )) X_子集 = 设施位置选择 ( 100 , 米制的 = “欧几里德式” , 优化器 = “懒惰” ). fit_transform(适合转换) ( X(X) )
从 杏子 进口 设施位置选择
从 sklearn公司 . 数据集 进口 加载位数(_D)
数据 = 加载位数(_D) () X_火车 = 数据 . 数据 [: 1250 ] 选择器 = 设施位置选择 ( n个样本 , 米制的 = “欧几里德式” , 优化器 = “懒惰” , 冗长的 = False(错误) ) 选择器 . 适合 ( X_火车 )
从 杏子 进口 基于功能的选择
从 sklearn公司 . 数据集 进口 fetch_20新闻组
从 sklearn公司 . 特征提取 . 文本 进口 Tfidf矢量器
列车数据 = fetch_20新闻组 ( 子集 = “火车” , 类别 = ( “科学医学” , '科学空间' )) 矢量器 = Tfidf矢量器 ( 停止字(_W) = “英语” , 最大特性(_F) = 1000 ) X_火车 = 矢量器 . fit_transform(适合转换) ( 列车数据 . 数据 ) #这将返回apricot中支持的稀疏矩阵
选择器 = 基于功能的选择 ( 100 , 凹面(_func) = “sqrt” , 优化器 = “两阶段” , 冗长的 = False(错误) ) 选择器 . 适合 ( X_火车 )
进口 numpy公司
从 杏子 进口 设施位置选择
X(X) = numpy公司 . 随机的,随机的 . 正常的 ( 20 , 1 , 大小 = ( 5000 , 25 )) X已订购 = 设施位置选择 ( 100 , 首字母_子集 = [ 1 , 5 , 6 , 8 , 10 ]). fit_transform(适合转换) ( X(X) ) 模型 = 设施位置选择 ( 1000 ). 适合 ( X(X) ) X已订购2 = X(X) [ 模型 . 排名 ]