ZhengHe

从头开始构建一个 Pascal 的解释器

发表于 2022-01-03 更新于 2026-06-18 分类于实践 Disqus：

前阵子无意中发现了一个系列教程：「Let’s Build A Simple Interpreter 」，简称 lsbasi。本来只是随便翻翻，但刚看完 Part-1 就发现作者 Ruslan Spivak 不仅是一个出色的软件工程师，文笔也相当不错，更难得的是他对学习这件事本身有着很深入的理解，这些见解甚至反馈到了这套教程的设计上。

阅读全文 »

Make It Stick - 学习本身是一件值得思考的事情

发表于 2021-11-28 更新于 2026-06-18 分类于读书 Disqus：

前段时间，我的朋友「肚子」向我推荐了 Make It Stick: The Science of Successful Learning 这本书 (以下简称 MIS)，读毕感觉相见恨晚。该书的讨论主题是学习这件事情本身，即研究人类学习的特点，找到适合人类的高效学习策略。如果用一句话向其它朋友推荐这本书，我想这句话一定是：学习本身是一件值得思考的事情。

阅读全文 »

对话系统-101

发表于 2021-07-24 更新于 2026-06-18 分类于系统设计 Disqus：

今年 6 月底，由于工作需要，花了两周时间调研对话系统，并在公司内部做了一次调研报告。本文意在将此报告整理成文字版，算是对这段时间付出的一个交代。

阅读全文 »

Born a Crime - 崔娃语录谈

发表于 2021-05-23 更新于 2026-06-18 分类于读书 Disqus：

因为之前在 Youtube 和 B 站上零星地看了一些 Trevor Noah 的 stand-up 和 Daily Show，加上最近在伴鱼 App 上与来自南非的老师学英语，我在大约四月中旬决定读一读「Born a Crime」这本书，书的内容本来并不多，但个人时间安排原因使得这个过程变得很长，直到昨天终于读完。

阅读全文 »

代码搜索引擎：基础篇

发表于 2021-05-09 更新于 2026-06-18 分类于系统设计 Disqus：

“Google 内部曾对工程师做一次调研，发现平均每位工程师每天会进行 5.3 次代码搜索会话 (session)，执行 12 个代码搜索请求；在 Github/Gitlab 等仓库托管服务中，搜索是工程师最常用的功能之一。”

阅读全文 »

调用链追踪系统在伴鱼：实践篇

发表于 2021-03-04 更新于 2026-06-18 分类于系统设计 Disqus：

此文同时发表在伴鱼技术博客上

在理论篇中，我们介绍了伴鱼在调用链追踪领域的调研工作，本篇继续介绍伴鱼的调用链追踪实践。在正式介绍前，简单交代一下背景：2015 年，在伴鱼服务端起步之时，技术团队就做出统一使用 Go 语言的决定。这个决定的影响主要体现在：

内部基础设施无需做跨语言支持
技术选型会有轻微的语言倾向

阅读全文 »

调用链追踪系统的设计维度

发表于 2020-12-20 更新于 2026-06-18 分类于系统设计 Disqus：

本文将调用链追踪系统的设计维度归结于以下 5 个：调用链数据模型、元数据结构、因果关系、采样策略以及数据可视化。我们可以把这 5 个维度当作一个分析框架，用它帮助我们在理论上解构市面上任意一个调用链追踪系统，在实践中根据使用场景进行技术选型和系统设计。如果你对调研相关系统很感兴趣，也欢迎参与到 Database of Tracing Systems 项目中，一起调研市面上的项目，建立起调用链追踪系统的数据库。

阅读全文 »

So, you want to trace your distributed system? Key design insights from years of practical experience (2014)

发表于 2020-11-29 更新于 2026-06-18 分类于论文 Disqus：

本文主要介绍一篇关于调用链追踪系统设计的论文。行文会尊从原论文的结构，但不是逐字翻译，以意译和加入个人理解的转述为主。

阅读全文 »

如何在 Golang 项目中处理好错误

发表于 2020-10-05 更新于 2026-06-18 分类于编程 Disqus：

造一辆能跑在路上的车并非难事，但要这辆车能在各种路况、气候和突发事件下安全行驶，事情就不再简单。如果把写程序比喻成造车，构建程序的主要功能就是让车跑起来，而处理好错误就是让车安全地跑。错误是程序的重要组成部分，能否在程序中处理好错误决定了软件的质量上限。在这篇博客中，我将介绍个人在 Golang 项目中错误处理的思考。

阅读全文 »

TiDB 为什么要用 Apache Arrow - 一个门外汉的思考

发表于 2020-09-20 更新于 2026-06-18 分类于系统设计 Disqus：

最近在阅读 TiDB 源码 util/chunk package 的过程中，看到了 Apache Arrow 这个项目 (下文简称 Arrow)：

// Chunk stores multiple rows of data in Apache Arrow format.
// See https://arrow.apache.org/docs/format/Columnar.html#physical-memory-layout
// Values are appended in compact format and can be directly accessed without decoding.
// When the chunk is done processing, we can reuse the allocated memory by resetting it.
type Chunk struct { /*...*/ }

心里自然而然会产生疑问：为什么要使用这个项目规定的数据存储格式？于是在阅读完 TiDB 相关源码和单测后，顺便搜寻并浏览一些有趣的资料 (见文末参考部分)，现在将这次调研的收获小结在这篇博客中。

阅读全文 »