保存好数据,不堆数据垃圾
乔治亚·欧姬芙 《红色山丘和白色贝壳》 1938
我们这些做仿真的人,一年下来的收获,就是一个写满了数据的硬盘。打开硬盘,是不是有打开仓库的感觉?看着名目繁多的文件夹,忍不住赞叹,自己咋这么能干,一年里干了这么多活。1. 攒了这么多数据,对比过的因素,整整齐齐地摆在这里,每个因素的影响规律,清清楚楚地梳理出来。2. 试过了这么多方案,所有设计过程,完完整整地保存在这里,可以看到方案如何一步步走到最终的方案。打开文件后,你会发现高兴得太早了。这些文件并没有保存住你想保存的东西。有谁能解释一下,1_与a_对比的是哪个因素?size1和size2到底对比的是哪个size?2. 方案报告是这样命名的:
***_final.doc,***_最终版.doc,***_上交版.doc
3. 还发现几个T的数据太单纯
/与某实验对比的仿真 /001.dat 002.dat 003.dat……999.dat
不知道要对比的实验在哪里、要算的是什么形状、要研究的是什么方案?没有丢掉数据,只不过看不懂数据的意思,这和没有数据有什么区别?唯一的区别就是看起来工作量好大。也许有人说,没关系,打开所有的数据文件,对比一条条设置,总可以找到每个文件有什么不同。也许可以回想起来当初为什么要算这些数据,从中又感到了什么规律。这种“睡美人”数据,当时用一个月算出来,今天你要用三个月看明白,这种数据还值得唤醒吗? 想象中亲手盖起的高楼,打开后看到的竟然是一大堆垃圾。放对位置的数据是高楼,胡乱堆放的数据是建材,没有来路的数据是垃圾。要让保存的数据有用,而且多年后打开还能看懂,就把数据放对位置、说明来路。 放对位置
2. 运行
请相信,一周内你需要看调试文件;一年后,这些调试文件只会让你找不到调试好的数据。说明来路
写个仿真日志,记录算了哪些算例,初步获得了什么印象。怎么知道你必须记录什么?打开一年前的数据,看看现在想知道什么。你会发现,当时要记录的条目很细致,一年后你对那些细节不再感兴趣。一年后你只想看当时认为没必要记录的几条干货,例如:结果有没有被采用、影响最大的因素是哪个、误差大概在什么范围。在文件名后写上日期,可以是创建文件的日期,或者完成的日期,这就是一个简单的版本号。以后你看看文件名,就知道哪个是最终的版本。不要小看这个功能,当时可以防止你混乱,一年后可以帮助你对齐时间,识别每个文件的身世。文件的修改时间不可靠,你可能后期无意中打开加了一个回车,文件的时间就错位了。
数据垃圾:放错了地方的宝贝。
数据废品:不知道是什么的宝贝。
你的硬盘是垃圾场还是高楼大厦,就看你如何保存数据文件。
无论你再忙,也要把你的数据文件放对位置、说明来路。