磁盘为“480GB 2.5英寸企业价值6Gb SATA SSD” 产品ID为“UCS-SD480GBKS4-EB” 2018年,服务器标配了磁盘 磨损最近似乎加速了(我现在正在记录磨损情况,以便在几天后得到更好的答案) 我已经用几年后购买的相同磁盘替换了大多数磁盘。 iotop显示恒定的8MB/s写入。 该系统正在8台服务器上运行hadoop。 hadoop文件系统位于旋转磁盘上,因此不应接触SSD 虽然磁盘IO看起来仍然很高(8MB/s),但根据供应商的建议,我已经大大降低了磁盘IO
-
2 大多数是重复的 serverfault.com/q/169676/28549 – 本·沃伊格特 5月10日21:07 -
2 iostat-t nvme0n1p6--人类1 可以让您随时了解从一秒钟到下一秒钟有多少数据被读/写到SSD驱动器。 (更换 nvme0n1p6 当然是SSD分区的名称) – 杰里米·弗里斯纳 5月12日3:56 -
你确定内核知道这些是SSD并使用TRIM等吗? – 托比约恩·瑞文·安徒生 5月12日5:03 -
@MikeKulls很酷,这意味着他们被智能网覆盖(如果你有智能网并且一直在付费的话),而且这不是50美元的国产级固态硬盘。 – 克里吉 5月13日7:03 -
1 @Criggie我们确实获得了1个SSD的保修,但我们又去了RMA,服务器已经停止运行。 我把它们都从备用磁盘中换了出来,这是一项了不起的工作,每个磁盘1个小时,一次只能换一个,在一个冰冷的交换环境中工作:-) – MikeKulls公司 5月16日3:34
4个答案
廉价SSD。 简单地说,这听起来像 许多 就像在这个系统中没有质量特别好的SSD一样,这将使1-2%的可用预期寿命转化为多TB数据的假设无效。 我建议对您使用的SSD的确切模型进行一些研究,以确认其实际额定寿命写持久性是多少,并且没有记录的固件问题。 过去五年左右的好成绩应该被评为 至少 100倍于其列出的容量(因此,1 TB SSD上的容量至少为100 TB),但理想情况下要高于此容量(相比之下,目前高端消费类1 TB SSDs的额定写入容量通常约为300 TB)。 阻止设备缓存。 如果您有使用SSD上空间的bcache、dm-cache、ZFS L2ARC或其他块设备缓存设置,则 可能 罪魁祸首,试着关掉它,看看会发生什么(好吧,除了可能严重影响性能之外)。 登录中。 大多数日志可能位于操作系统卷上。 如果您启用了详细日志记录,并且您的应用程序 非常 繁忙时,这很容易在一周内达到TB的范围。 但它也可以是其他东西,比如来自SELinux的日志、进程记帐或审计守护进程。 非块缓存。 基本上,东西在下面 /变量/缓存 或存储缓存的其他位置(例如 ~/.cache 在用户主目录中)。 除非它是一个非常活跃的终端服务器,否则这应该不会达到要求的数量,但值得检查。 交换。 可能不是主要原因,因为达到所需的数字会导致频繁交换,从而导致系统上的其他性能问题。
#/usr/share/bcc/tools/filetop 23:56:12平均载荷:1.32 0.83 0.60 4/1273 563644 TID命令读取写入R_Kb W_Kb T文件 563614是0 36757 0 294056 R foo.bar [..]
-
-
1 @答:。 L-saynotoAI理想情况下,被调查服务器上的网络数据配置为仅收集所有相关指标,并通过网络将其发送到运行网络数据主实例的单独主机,该主机将所有内容写入时间序列数据库并为web-UI服务。 或者,您可以使用telegraf/grafana、prometheus/grafan或类似工具实现此类监控。 netdata的优点是它的主收集器非常高效,它在UI中提供了一组精心管理的有用面板,而且是现成的。 – 麦克斯切莱皮齐 5月13日21:58 -
@答:。 L-saynotoAI FWIW,截至2024年,每月1 TB可能只消耗SSD耐久性评级预算中相对较小的一部分。 例如,Micron 7500数据中心SSD的额定值为每天1或3个驱动器写入(DWPD),保修期为5年。 因此,使用-3.84 TB/1 DWPD SSD,每月1 TB的写负载消耗了每月耐久性预算的1/115左右。 – 麦克斯切莱皮齐 5月13日22:32