100来行代码, 自己动手写一个模板引擎

作者: 前端小咖 | 来源:发表于2019-08-14 13:29 被阅读18次

100来行代码, 自己动手写一个模板引擎
自制一个简单的模板引擎
简单的模版引擎
（笔记）php-smarty模板引擎
手写一个模板引擎
20行代码javascript模板引擎
JavaScript---模版引擎
建立AMD、CMD、nodeJS通用的模板引擎，并封装发布到np
极简Node教程-七天从小白变大神（三：你所不知道的模板表单）
自定义MVC开发的Xcode模板

一张图说明Ejs模板引擎的原理

上面一张图，已经大概把一个简单模板引擎(这里以EJS为例)的原理解释得七七八八了。本文将描述一个简单的模板引擎是怎么运作的？包含实现的关键步骤、以及其背后的思想。

基本上模板引擎的套路也就这样了，但这些思想是通用的，比如你在看vue的模板编译器源码、也可以套用这些思想和方法.

基本API设计

我们将实现一个简化版的EJS, 这个模板引擎支持这些标签:

<% script %> - 脚本执行. 一般用于控制语句，不会输出值例如

<%if(user) {%>

some thing<% } %>复制代码

<%= expression %> - 输出表达式的值，但是会转义HTML:

{%=title%}复制代码

<%- expression %> - 和 <%= expr %> 一样，只不过不会对HTML进行转义

<%% 和 %%> - 表示标签转义, 比如 <%% 会输出为 <%

<%# 注释 %> - 不会有内容输出

下面是一个完整的模板示例，下文会基于这个模板进行讲解:

<%= title %><%% 转义 %%><%# 这里是注释 %><%- before %><%if(show) {%>

root<% } %>复制代码

基本API设计

我们将模板解析和渲染相关的逻辑放到一个Template类中，它的基本接口如下:

exportdefaultclassTemplate {publictemplate:string;privatetokens:string[] = [];privatesource:string="";privatestate?: State;privatefn?: Function;publicconstructor(template:string){this.template=template; }/**

* 模板编译

*/publiccompile(){this.parseTemplateText();this.transformTokens();this.wrapit(); }/**

* 渲染方法，由用户指定一个对象来渲染字符串

*/publicrender(local: object){ }/**

* token解析

* 将<% if (codintion) { %>

* 解析为token数组，例如['<%', ' if (condition) { ', '%>']

*/privateparseTemplateText(){}/**

* 将Token转换为Javascript语句

*/privatetransformTokens(){}/**

* 将上一个步骤转换出来的Javascript语句，封装成一个渲染方法

*/privatewrapit(){}}复制代码

token解析

第一步我们需要将所有的开始标签(start tag)和结束标签(end tag)都解析出来，我们期望的解析结果是这样的：

[ "\n\n", "<%=",

"title",

"%>", "\n\n ", "<%%",

"转义",

"%%>", "\n ", "<%#",

" 这里是注释 ",

"%>", "\n ", "<%-",

"before",

"%>", "\n ", "<%",

"if(show) {",

"%>", "\n

root\n ", "<%",

"}",

"%>", "\n\n\n"]复制代码

因为我们的模板引擎语法非常简单, 压根就不需要解析成什么抽象语法树(AST)(即省去了语法解析, 只进行词法解析). 直接通过正则表达式就可以实现将标签抽取出来。

先定义正则表达式, 用来匹配我们所有支持的标签：

//<%% %%>用于转义//<%脚本// <%= 输出脚本值

// <%- 输出脚本值，unescape

// <%# 注释

// %>结束标签const REGEXP = /(<%%|%%>|<%=|<%-|<%#|<%|%>)/;复制代码

使用正则表达式逐个进行匹配，将字符串拆分出来. 代码也很简单:

parseTemplateText() {letstr= this.template;constarr = this.tokens;// 通过exec方法可以获取匹配的位置, 如果匹配失败则返回nullletres = REGEXP.exec(str);letindex;while(res) { index = res.index;// 前置字符串if(index !==0) { arr.push(str.substring(0, index));str=str.slice(index); } arr.push(res[0]);// 截断字符串，继续匹配str=str.slice(res[0].length); res = REGEXP.exec(str); }if(str) { arr.push(str); } }复制代码

简单的语法检查

Ok，将标签解析出来后，就可以开始准备将它们转换称为‘渲染’函数了.

首先进行一下 简单的语法检查 ，检查标签是否闭合：

conststart ="<%";// 开始标签constend ="%>";// 结束标签constescpStart ="<%%";// 开始标签转义constescpEnd ="%%>";// 结束标签转义constescpoutStart ="<%=";// 转义的表达式输出constunescpoutStart ="<%-";// 不转义的表达式输出constcomtStart ="<%#";// 注释if(tok.includes(start) && !tok.includes(escpStart)) { closing =this.tokens[idx +2];if(closing ==null|| !closing.includes(end)) {thrownewError(`${tok}未找到对应的闭合标签`); }}复制代码

转换

现在开始遍历token。我们可以使用一个有限的状态机(Finite-state machine, FSM)来描述转换的逻辑.

状态机是表示有限个状态以及在这些状态之间的转移和动作等行为的数学模型。简单而言，有限状态机由一组状态、一个初始状态、输入和根据输入及现有状态转换为下一个状态的转换函数组成。它有三个特征:

状态总数是有限的。

任一时刻，只处在一种状态之中。

某种条件下，会从一种状态转变到另一种状态

稍微分析一下，我们模板引擎的状态转换图如下:

通过上图可以抽取出以下状态:

enumState{ EVAL,// 脚本执行ESCAPED,// 表达式输出RAW,// 表达式输出不转义COMMENT,// 注释LITERAL// 字面量，直接输出}复制代码

Ok, 现在开始遍历token:

this.tokens.forEach((tok, idx) => {// ...switch (tok) {/**

* 标签识别

*/case start:// 脚本开始this.state = State.EVAL;break; case escpoutStart:// 转义输出this.state = State.ESCAPED;break; case unescpoutStart:// 非转义输出this.state = State.RAW;break; case comtStart:// 注释this.state = State.COMMENT;break; case escpStart:// 标签转义this.state = State.LITERAL;this.source += `;__append('<%');\n`;break; case escpEnd:this.state = State.LITERAL;this.source += `;__append('%>');\n`;break; case end:// 恢复初始状态this.state = undefined;break;default:/**

* 转换输出

*/if(this.state !=null) { switch (this.state) { case State.EVAL:// 代码this.source += `;${tok}\n`;break; case State.ESCAPED:// stripSemi 将多余的分号移除this.source += `;__append(escapeFn(${stripSemi(tok)}));\n`;break; case State.RAW:this.source += `;__append(${stripSemi(tok)});\n`;break; case State.LITERAL:// 因为我们把字符串放到单引号中，所以transformString将tok中的单引号、换行符、转义符进行转移this.source += `;__append('${transformString(tok)}');\n`;break; case State.COMMENT:// 什么都不做break; } }else{// 字面量this.source += `;__append('${transformString(tok)}');\n`; } }});复制代码

经过上面的转换，我们可以得到这样的结果:

;__append('\n<html>\n <head>');;__append(escapeFn( title ));;__append('</head>\n <body>\n ');;__append('<%');;__append(' 转义 ');;__append('%>');;__append('\n ');;__append('\n ');;__append( before );;__append('\n ');;if(show) {;__append('\n <div>root</div>\n ');; };__append('\n </body>\n</html>\n');复制代码

最后一步，生成函数

现在我们把转换结果包裹成函数:

wrapit() {this.source= `\const __out = [];const __append = __out.push.bind(__out);with(local||{}) {${this.source}}return__out.join('');\`;this.fn =newFunction("local","escapeFn",this.source); }复制代码

这里使用到了 with 语句，来包裹上面转换的代码，这样可以免去local对象访问限定前缀。

渲染方法就很简单了，直接调用上面包裹的函数:

render(local:object) {returnthis.fn.call(null, local, escape); }复制代码

跑起来

const temp = new Template(`<%= title %><%% 转义 %%><%# 这里是注释 %><%- before %><%if(show) {%>

root<% } %>`);temp.compile();temp.render({ show: true, title: "hello", before: "xx" })////hello////<% 转义 %>////xx////root//////复制代码

你可以在CodeSandbox运行完整的代码: