python-如何使用panda正确读取文件-堆栈溢出

我尝试这样读取txt文件：

id sub_id标识q_length alignment_length-mismatches gap_opens evalue bit_score stitle>ID1757 49.512 454 410 207 0 3.71e-159 461序列11511来自美国专利8343764>ID6556 gb | AEI19864.1 | 56.442 372 326 140 1 1.36e-135 394序列412来自美国专利7960148

我需要正确设置列。但在上一篇专栏中，我有几个词。我需要把它放在一列。

我还有这个案例：

id sub_id标识q_length alignment_length-mismatches gap_opens evalue bit_score stitle>ID54545 sp | Q59226.1 | 31.340 454 418 255 11 8.73e-49 178 RecName:Full=环麦芽糊精酶；短=CDase；短=CDase I-5；AltName:Full=环麦芽糊精水解酶，脱环[芽孢杆菌属（in:硬菌属）]

我需要将RecName后面的所有文本放在一列中

我尝试设置列名并打印最后一列，以查看系统如何定义列。

df1_column_names=[“id”“sub_id”“identity”“q_length”“alignment_length'”“不匹配”“gap_opens”“evalue”“bit_score”“stitle”]df1=pd.read_csv（“路径”，名称=df1_column_names）newdf=df1['title']newdf.to_csv（'path'，index=False）

但我犯了个错误。此外，在其他情况下，系统将最后一列定义为“美国专利7960148中的序列412”，例如“7960148”

问2023年10月23日22:56

铃木

134枚青铜徽章

1

你是不是失踪了子id（_I）在第一排ID1757?
– 安德烈·凯塞利
评论 2023年10月23日23:08
1

“但我犯了个错误”，你犯了什么错误？
– 苏拉吉·舒里
评论 2023年10月23日23:09
1

我认为熊猫不会成功阅读这篇文章。但您可以编写一些正则表达式，逐行解析，然后将真正的CSV文件写入磁盘或io.StringIO。那么你有熊猫可以使用的东西。
– 德莱尼
评论 2023年10月24日2:28

添加评论 |

0 您的答案

以客人身份发布

姓名

电子邮件

必需，但从未显示

Post as a guest

Name

Required, but never shown

单击“发布您的答案”，表示您同意我们的服务条款并确认您已阅读我们的隐私政策.

堆栈溢出上的Collections™

如何正确读取熊猫文件

0

您的答案

浏览标记的其他问题
蟒蛇
熊猫
一串
数据帧
文本
或问你自己的问题.

热门网络问题

堆栈溢出上的Collections™

0

知道谁能回答吗？共享指向此的链接问题通过电子邮件,推特，或脸谱网.

您的答案

注册或登录

以客人身份发布

浏览标记的其他问题蟒蛇熊猫一串数据帧文本或问你自己的问题.

浏览标记的其他问题
蟒蛇
熊猫
一串
数据帧
文本
或问你自己的问题.