JavaScript构建一个Markdown解析器

发布时间:2025-03-27

Markdown是一种轻量级标记语言,以简单易读的语法和可生成丰富多彩的内容,受到开发者们的青睐。无论是文档编写,还是博客传记都广泛使用到Markdown。本文介绍试用JavaScript来构建一个Markdown解析器,解锁Markdown的强大之处。

什么是Markdown解析器

Markdown解析器的就是讲Markdown文本解析之后转换成HTML格式,供给浏览器渲染页面。例如文本中 # 标题 会被转换成 <h1>标题</h1> 形式的代码。

解析器基本实现

要想解析Markdown文本,首先要先提取出Markdown文本中各类标记,可以使用正则来获取,例如 /^# (.*$)/gim 可以获取到所有的 # 标题 标记,再将其替换成对应的HTML代码。

function parseMarkdown(markdown) {
    // 转换标题
    markdown = markdown.replace(/^# (.*$)/gim, '<h1>$1</h1>');
    markdown = markdown.replace(/^## (.*$)/gim, '<h2>$1</h2>');
    markdown = markdown.replace(/^### (.*$)/gim, '<h3>$1</h3>');

    // 转换加粗
    markdown = markdown.replace(/\*\*(.*?)\*\*/gim, '<strong>$1</strong>');

    // 转换斜体
    markdown = markdown.replace(/\*(.*?)\*/gim, '<em>$1</em>');

    // 转换链接
    markdown = markdown.replace(/\[(.*?)\]\((.*?)\)/gim, '<a href="$2">$1</a>');

    // 换行处理
    markdown = markdown.replace(/\n/gim, '<br />');

    return markdown.trim();
}

// 测试 Markdown 文本
const markdownText = `
# 欢迎使用 Markdown 解析器
## 副标题
这是 **加粗** 和 *斜体* 的示例。
[点击访问](https://scung.cn)
`;

console.log(parseMarkdown(markdownText));

上面的代码中 parseMarkdown 就是我们定义的Markdown解析器,内部通过使用 replace 方法进行内容的替换,替换的依据使用正则表达式来判断,完成了Markdown的基本解析

<h1>欢迎使用 Markdown 解析器</h1>
<br />
<h2>副标题</h2>
<br />
这是 <strong>加粗</strong><em>斜体</em> 的示例。
<br />
<a href="https://scung.cn">点击访问</a>
<br />

实现代码高亮

首先我们定义一个自定义解析代码的解析器,然后我们可以引入外部库,使用 highlight.js 实现代码高亮。

function parseCodeBlocks(markdown) {
    return markdown.replace(/```([\s\S]*?)```/gim, '<pre><code>$1</code></pre>');
}

结合上 highlight.js

<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.7.0/styles/default.min.css">
<script src="https://cdnjs.cloudflare.com/ajax/libs/highlight.js/11.7.0/highlight.min.js"></script>
<script>
    let code = '``` let code = 1;```';

    let codeBlock = parseCodeBlocks(code);

    //将codeBlock插入到页面后调用代码高亮
    hljs.highlightAll();
</script>

构建一个 Markdown 解析器从简单正则到功能全面的扩展,可以灵活适配不同场景。对于小型项目,手动实现基础解析已足够;而大型项目中,结合库和工具则更高效。

其他阅读

记录Unity中的坑

Unity虽然使用C#来进行开发,但是Unity所使用的运行时和.net的原生运行时却又差别,这导致在.net中的某些代码块在Unity中运行会出现错误。

查看原文

本地部署DeepSeek大模型服务

之前的文章介绍了怎么对接DeepSeek的API实现自己的助手,但是依旧使用的DeepSeek官方服务器,在高峰期还是会出现超长延时的情况,本文介绍另一种思路,通过在本机上部署DeepSeek大模型服务来告别卡顿崩溃。

查看原文

WPF打包成单文件

在开发WPF程序时,有时我们需要把整个软件打包成一个文件,这样可以方便分发,本文将会介绍怎么把WPF打包成单文件形式。

查看原文

Entity Framework Core链接Oracle的问题

最近使用 Entity Framework Core 来链接 Oracle 11g 数据库,发现很多 LINQ 语句使用起来都会有问题,查看日志输出发现是生成SQL语句无法被 11g 版本执行,好在Oracle官方已经给我们提供了解决方案。

查看原文

Angular 中跨分模块后路由复用问题

当我们的 Angular 应用越来越大后,就需要考虑使用模块或者直接使用库来将解体应用,使用时进来懒加载,加快访问速度。当跨分模块后,普通的路由复用策略就是失效,需要额外的解决方法。

查看原文