概述
使用fs.watchfile
fs.watchFile(dir, (curr, prev) => {});
问题: 回调存在一定的延迟,因为watchfile是通过轮询检测文件变化,而且只能监听一个文件。
使用fs.watch
fs.watch(dir, (event, filename) => {});
watch 通过操作系统提供的文件更改通知机制,在 Linux 操作系统使用 inotify,在 macOS 系统使用 FSEvents,在 windows 系统使用 ReadDirectoryChangesW,而且可以用来监听目录的变化,在监听文件夹的场景中,比创建 N 个 fs.watchfile 效率高出很多。
user@LAPTOP-DC22I3FC MINGW64 /d/gitpro/example/node
$ node index.js
test.md change
test.md change
因而可以进一步判断是否触发状态是 change:
fs.watch(dir, (event, filename) => {
if (filename && event === "change") {
console.log(`${filename} file Changed`);
}
});
问题: 回调使用了2次,原因是文件被写入时,可能触发多次写操作,即使只保存了一次。但我们不需要这么敏感的回调,因为通常认为一次保存就是一次修改,系统底层写了几次文件我们并不关心。
作者要表达的意思是,在不同平台下,fs.watch 的规则可能会不同,原因是 fs.watch 分别使用了各平台提供的 api,所以无法保证这些 api 实现规则的统一性。
时间判断
let previousMTime = new Date(0);
fs.watch(dir, (event, filename) => {
if (filename) {
const stats = fs.statSync(filename);
if (stats.mtime.valueOf() === previousMTime.valueOf()) {
return;
}
previousMTime = stats.mtime;
console.log(`${filename} file Changed`);
}
});
log 由 4 个变成了 3 个,但依然存在问题。我们认为文件内容变化才算有修改,但操作系统考虑的因素更多,所以我们再尝试对比文件内容是否变化。
校验文件 md5
let md5Previous = null;
fs.watch(dir, (event, filename) => {
if (filename) {
const md5Current = md5(fs.readFileSync(buttonPressesLogFile));
if (md5Current === md5Previous) {
return;
}
md5Previous = md5Current;
console.log(`${filename} file Changed`);
}
});
等
作者讨论了一些实现文件夹监听的基本方式,可以看出,使用了各平台原生 API 的 fs.watch
并不那么靠谱,但这也我们监听文件的唯一手段,所以需要基于它进行一系列优化。
而实际场景中,还需要考虑区分文件夹与文件、软连接、读写权限等情况。
另外用在生产环境的库,也基本使用 50 到 100 毫秒解决重复触发的问题。
所以无论 chokidar 或 node-watch,都大量使用了文中提及的技巧,再加上对边界条件的处理,对软连接、权限等情况处理,将所有可能情况都考虑到,才能提供较为准确的回调。
可以看出,第三方 npm 库都采取不信任操作系统回调的方式,根据文件信息完全重写了判断逻辑。
可见,信任操作系统的回调,就无法抹平所有操作系统间的差异,唯有统一重写文件的 “写入”、“删除”、“修改” 等逻辑,才能保证在全平台的兼容性。
总结
利用 nodejs 监听文件夹变化很容易,但提供准确的回调却很难,主要难在两点:
- 抹平操作系统间的差异,这需要在结合 fs.watch 的同时,增加一些额外校验机制与延时机制。
- 分清楚操作系统预期与用户预期,比如编辑器的额外操作、操作系统的多次读写都应该被忽略,用户的预期不会那么频繁,会忽略极小时间段内的连续触发。
另外还有兼容性、权限、软连接等其他因素要考虑,fs.watch 并不是一个开箱可用的工程级别 api。
网友评论