联苯双酚
描述
联苯双酚是一个开源的命令行脚本集合,用于处理成本加保险费、运费文件夹。这个该软件包由晶体学开放数据库团队开发开发人员。每个脚本使用的详细信息可以通过调用命令从包中获取--帮助
和--使用
命令行选项。例如:
cif_filter--帮助cif_filter--用法
cif _ cd检查–解析CIF文件,检查某些数据值是否与COD匹配要求和IUCr数据验证标准(版本:2000.06.09,ftp://ftp.iucr.ac.uk/pub/dvantests网站或ftp://ftp.iucr.org/pub/dventests网站)
成本加运费价存款–使用CGI沉积界面将CIF存入COD数据库。
cif _ cd编号–找到COD编号用于文件列表中给定目录中的.cif文件。
cif更正标记–更正CIF文件中拼写错误的标签。
cif过滤器–解析CIF文件并打印出CIF中的基本数据值格式,COD CIF样式。
此脚本还具有许多功能–它可以恢复空间组对称运算符的符号(参考预定义表),解析和整理_化学公式
,计算细胞体积,排除未知或“空”标签,并添加指定的书目数据。
cif固定值–具有指定或转换单位的正确温度值介于摄氏度和开氏度之间。更衣室/环境将“temperature”设置为适当的数值。将其他未定义的值(无、未测量等)固定为“?”符号。确定对标准I/O流所做更改的报告。
根据CIF字典修复CIF文件中的枚举值。
cif标记标识符–根据距离和占用情况判断,CIF文件中的标记混乱。
cif分子–从CIF文件中恢复分子。
cif _选择–读取CIF并打印出所选标记及其值。
到岸价拆分–将CIF文件拆分为单独的文件,每个文件有一个数据段。
该脚本解析给定的CIF文件以分隔数据块能够分割格式不正确的嵌套CIF文件。
cif _ split_原语–将CIF文件拆分为单独的文件,每个文件有一个数据段。
这是拆分器的一个非常原始的版本期望每个数据_。。。部分以新行开始。它可能会失败一些不遵循这种约定的CIF文件。用于拆分任何格式正确的CIF文件,都必须进行完整的CIF解析使用CIF语法和文件的标记化。
安装
联苯双酚包是通过源代码分发的。关于Debian/Ubuntu操作系统,它可以仅以二进制形式从标准安装软件存储库。
来自软件包存储库
联苯双酚可以从的标准软件包存储库安装Debian(自Debian 10 Buster以来)和Ubuntu(自Ubuntu 18.10 Cosmic墨鱼以来):
sudo apt-get安装cod-tools
从来源
要从源代码准备包,必须遵循以下步骤:
示例
修复语法错误的结构:
使用以下命令可以自动修复一些简单的常见CIF语法错误cif过滤器--固定语法
选项。例如,这种结构:
数据已中断_publ_section_title“离场报价回路__原子_位置_标签_原子站点分形x_原子站点分形_原子站点分数zC 0 0 0
可以修复(如果存储在测试.cif
):
cif_filter—修复test.cif
获得的结构:
数据已中断_publ_section_title'离场报价'回路__原子_位置_标签_原子站点分形x_原子站点分形_原子站点分数zC 0 0 0
一条警告消息告知所做的操作:
cif_filter:test.cif(2)data_broken:警告,双引号字符串缺少右引号--已修复。
哪里:
cif过滤器
所用脚本的名称;
测试.cif
是CIF文件的名称;
2
是文件中的行号;
数据已中断
是CIF数据块名称;
警告
是严重程度;
- rest是消息文本。
从Web中获取结构,过滤并修复它,恢复水晶晶体中每种化合物的含量和计算汇总公式:
卷发--无声https://www.crystallography.net/cod/2231955.cif \|cif筛选器\|cif固定值\|cif分子\|cif单元格内容--使用附加氢
获得的结果:
C9 H14牛C10 H6 O6 S2氢气O
以及警告信息:
cif_molecule:-data_2231955:警告,给出的是39个原子的多重数比,而不是多重数——采用计算值。
从Web获取结构并标记共享同一站点的备用原子:
卷发--无声https://www.crystallography.net/cod/2018107.cif \|cif标记标识符\|cif_select--cif--标记_atom_site_label
获得的结果:
数据2018107回路__原子站点类型符号_原子_位置_标签_原子站点分形x_原子站点分形_原子站点分数z_原子位置_原子站点地址类型_原子网站地址标签_原子站点定义标志_原子站点占用_atom_site_symmetry_多重性_atom_site监控程序集_原子站点监控程序组铅Pb1 0.5000 0.0000 0.2500 0.0213(13)Uani d S 1 4。Mo Mo2 0.0000 0.0000 0.00000 0.022(4)Uani d S 14。铅Pb3 0.5000 0.5000 0.0000 0.025(2)Uani d SP 0.881(8)4 A 1钼Mo3 0.5000 0.5000 0.0000 0.025(2)Uani d SP 0.119(8)4 A 2Mo Mo1 0.0000 0.5000 0.2500 0.018(3)Uani d S 1 4。O O1 0.2344(13)-0.1372(14)0.0806(6)0.0302(17)乌阿尼。1 1 . .O O2 0.2338(14)0.3648(14。1 1 . .
以及输出消息:
cif_mark_disorder:-data_2018107:注,原子“Mo3”、“Pb3”标记为替代物。cif_mark_disorder:-data_2018107:注意,有1个站点标记为无序集合。
注释:原子第三季度
和第3页
尽可能共享同一站点通过检查他们的坐标发现。此外,他们的占用率接近1。在原始CIF文件中,这些站点具有二者都_atom_site监控程序集
和_原子站点监控程序组
设置为'.
'.
许可证
联苯双酚根据LGPL-3型自v2.4以来的免费软件许可证。
引用
如果您使用联苯双酚在您的研究中,请引用以下论文:
Vaitkus,A.、Merkys,A.和Gražulis,S.(2021)。使用晶体学验证晶体学开放数据库信息框架。应用晶体学杂志,54(2), 661-672.数字对象标识:10.1107/S1600576720016532号(BibTeX公司,纯文本)
Merkys,A.、Vaitkus,A.、Butkus,J.、Okulič-Kazarinas,M.、Kairys,V.和Graíulis,S.(2016年)。COD::CIF::Parser:用于Perl语言的纠错CIF分析器。应用晶体学杂志,49(1), 292–301.数字对象标识:10.1107/1600576715022396(BibTeX公司,尾注/参考,纯文本)
Graíulis,S.、Merkys,A.、Vaitkus,A.和Okulič-Kazarinas,M.(2015)。根据晶体结构计算化学计量分子组成。应用晶体学杂志,48(1), 85-91.数字对象标识:10.1107/1600576714025904(BibTeX公司,尾注/参考,纯文本)