写点什么

AI 写代码总是乱?吴恩达力推的测试驱动开发(TDD),能帮你兜底

  • 2025-09-20
    浙江
  • 本文字数:4122 字

    阅读完需:约 14 分钟

为什么 AI 写代码总是乱?因为它没目标。测试驱动开发(TDD) 就是给它戴上眼罩还能跑直线的护栏。


你有没有遇到过这种情况,你对 AI 说,「帮我写个登录功能」


结果,它给你加了个验证码功能,但你根本没打算要。或者它只支持密码登录,完全不管手机号、第三方登录。


更糟糕的是,你改了一个小 bug,却莫名其妙导致其他功能挂掉。


这就是 AI 编程的三大痛点:


1、模糊性


AI 天生就具有创造性和模糊性,你用自然语言描述一个需求,比如:帮我写一个登录功能。


AI 对这句话的理解可能有十几种方式。它可能会添加「记住我」功能,或者选择一个你并不喜欢的验证库,或者仅仅支持密码登录,不支持手机号等其他第三方登录。


这种不确定性是 AI 编程最大的挑战。


2、缺乏全局感知


AI 缺乏对整个代码库的全局理解。


你让它修复一个小 bug,它可能会在修复的同时,无意中破坏了几个其他不相关的功能。


这种「回归」问题在 AI 编程中非常常见,而且极难察觉。


3、调试成本高


传统的编程流程是:写代码 -> 手动测试 -> 发现 bug -> 人工调试。


而调试是整个编程环节中最耗费心智和时间的部分,有的 bug 你在调试过程中甚至能直接把你弄崩溃。


那有没有办法,把这匹野马拉回跑道?


答案是:测试驱动开发(TDD)


测试驱动开发(TDD) 怎么解决这些问题?


TDD 的核心,就是先写测试,再写代码。这一步,彻底改变了你和 AI 的协作模式。


1、把模糊需求变成精确目标:


我们通过编写测试用例,将模糊的自然语言需求,转化为精确、可执行的机器语言规范。


1)没测试时


你想让 AI 帮你写一个用户登录注册功能,AI 随便发挥,最后是不是你想要的?看运气。


2)有测试时


我们先把测试写好:


当输入有效邮箱和密码时,数据库里必须多一条记录,并且函数返回一个包含用户 ID 的对象。

当密码少于 8 位时,必须抛出 PasswordTooShortError 异常。


这样 AI 在写代码的时候就能明白他的目标是什么,测试用例可以将 AI 的创造力约束在一个确定的轨道上,迫使它精准地实现你想要的行为,而不是它自己想象的行为。


2、给你一张回归安全网:


一套全面的测试套件,就是一张「回归」安全网。


当你让 AI 进行任何修改(无论是添加新功能还是修复 bug)后,你只需运行一遍完整的测试。


如果某个不相关的测试突然失败了,你就立刻知道 AI 的这次修改产生了副作用。


你可以马上让 AI 撤销修改(或用 git reset),并告诉它:你的修改破坏了 test_user_profile_update 这个测试,请在不破坏它的前提下重新修复。


有了这张网,AI 再也不敢牵一发而动全身。


3、调试从此更轻松:


传统流程:写代码 → 手动测试 → 找 bug → 人工调试。


TDD 流程:写测试 → AI 写代码 → 跑测试 → 把失败日志丢给 AI。


AI 比人类更擅长读机器日志。你只需要做反馈提供者,不用再一行行 debug。

如何快速上手?

现在我们知道的测试驱动开发的好处,那怎么样去编写清晰、全面的测试用例呢?

1、核心原则

编写清晰、全面的测试用例,本质上就是在为 AI 设定一个明确、无歧义的目标和验收标准


所以,编写测试用例的黄金法则是:只描述「做什么」 (What),不要规定「怎么做」 (How)


1)做什么


当输入 X 时,系统应该产生输出 Y,并且其状态应该从 A 变为 B。


2)怎么做


不要在测试用例里告诉 AI 要用哪个算法、哪个设计模式。那是它的工作。


你的任务就是定义所有可能的行为场景预期结果

2、实际案例

我们以一个常见的需求为例:


创建一个用户注册函数


第 1 步:定义核心成功路径


首先,思考这个功能在最理想、最正常的情况下应该如何工作。


1)行为


一个新用户使用有效的邮箱和密码进行注册。


2)预期结果


  1. 数据库中应该新增一个用户记录。

  2. 新用户的邮箱和密码应该被正确保存。

  3. 函数应该返回成功状态或新创建的用户对象。


测试用例举例:


# 文件名: test_user_registration.py
def test_successful_registration_with_valid_credentials(): """ 测试:当提供有效的邮箱和密码时,用户应该能成功注册。 """ # 1. 准备 (Arrange) - 定义输入数据 email = "test@example.com" password = "a_strong_password123"
# 2. 执行 (Act) - 调用我们想让AI实现的函数 result, new_user = register_user(email, password)
# 3. 断言 (Assert) - 验证结果是否符合预期 assert result.is_success() is True # 检查返回状态 assert new_user is not None # 确保返回了用户对象 assert new_user.email == email # 检查邮箱是否正确 assert database.find_user_by_email(email) is not None # 确认用户已存入数据库
复制代码


测试函数的名称 test_successful_registration_with_valid_credentials 要取的非常直白,让 AI 能直接从名字理解测试的意图。


通过断言(assert)部分就可以知道验证结果是否符合预期。


第 2 步:定义已知的失败路径和边界情况


这一步你需要思考,在哪些情况下这个功能应该会失败?这部分至关重要,因为它为 AI 提供了护栏,防止它写出有漏洞的代码。


场景 1:无效的邮箱格式


1)行为


用户尝试用一个格式不正确的邮箱注册。


2)预期结果


注册应该失败,不能在数据库中创建用户,并返回一个明确的错误信息。


测试用例举例:


def test_registration_fails_with_invalid_email_format():    """    测试:当邮箱格式无效时,注册应该失败。    """    email = "not-an-email"    password = "a_strong_password123"
result, new_user = register_user(email, password)
assert result.is_success() is False # 必须失败 assert "Invalid email format" in result.error_message # 检查错误信息 assert database.find_user_by_email(email) is None # 确保数据库里没有创建用户
复制代码


场景 2:密码太短


1)行为


用户尝试使用一个过短的密码注册。


2)预期结果


注册失败,并提示密码太短。


测试用例举例:


def test_registration_fails_with_password_too_short():    """    测试:当密码少于8个字符时,注册应该失败。    """    email = "test@example.com"    password = "short"  # 假设我们规定密码至少8位
result, new_user = register_user(email, password)
assert result.is_success() is False assert "Password is too short" in result.error_message
复制代码


场景 3:邮箱已被注册


1)行为


用户尝试使用一个已经存在于数据库中的邮箱进行注册。


2)预期结果


注册失败,并提示邮箱已被使用。


def test_registration_fails_when_email_already_exists():    """    测试:当邮箱已经被注册时,再次注册应该失败。    """    # 准备:先在数据库里创建一个用户    existing_email = "existing@example.com"    database.create_user(email=existing_email, password="some_password")
# 执行:尝试用同一个邮箱再次注册 result, new_user = register_user(existing_email, "another_password")
assert result.is_success() is False assert "Email already in use" in result.error_message
复制代码


第 3 步:将测试用例交给 AI


现在,你已经有了一个清晰、全面的测试文件 (test_user_registration.py)。接下来,你与 AI 的互动就变得非常简单和高效:


1)提供上下文


将整个测试文件的代码提供给 AI。


2)提示词和 AI 交互


这是我的测试文件 test_user_registration.py。请在 user_service.py 文件中编写 register_user 函数的实现,确保它能够通过所有这些测试。这个函数需要与一个 database 对象交互。


3)迭代与反馈


AI 会生成第一版代码,然后你把测试运行起来,这时候很有可能会有几个测试失败。你将测试失败的完整输出日志直接复制粘贴给 AI,说:这个测试失败了,这是日志,请修复它。


AI 就会根据错误日志自动去修复代码问题,然后重复这个过程,直到所有的测试全部通过。


这样你的用户注册功能就算完整开发好了,就算后面再开发其他功能的时候不小心修改了这部分的代码,你只要跑一遍测试用例,就知道这部分功能有没有问题。

关键技巧总结

最后总结一下测试驱动开发,编写测试用例的一些重要关键点。


1)命名一定要见名知意,容易理解


函数名和变量名应该像一个句子一样描述其意图,让人一看就能理解,这样 AI 也容易理解你这个测试是干嘛用的


2)单一职责原则


每个测试用例只测试一个具体的行为或场景。不要把多个检查混在一个测试里。


3)使用 Arrange-Act-Assert 结构


这是一种标准的测试模式,它清晰地分开了「准备数据」、「执行操作」和「验证结果」,AI 非常擅长理解这种结构化的逻辑。


Arrange(准备):为你的测试设置好所有的「前提条件」和「输入数据」。


Act(执行):执行你真正想要测试的那个核心动作或函数。


Assert(断言):验证执行步骤的结果是否符合你的预期


使用 AAA 模式的清晰测试案例:


def test_successful_login_returns_auth_token():    # Arrange (准备)    email = "test@test.com"    password = "password123"    # 假设用户已经存在于数据库中    create_user_in_database(email, password)
# Act (执行) auth_token = login_service.login(email, password)
# Assert (断言) assert auth_token is not None assert isinstance(auth_token, str) assert len(auth_token) == 32 # 假设token是32位
复制代码


4)断言要精确


不要只用 assert True。要断言具体的值、状态变化、或特定的错误信息。


举例,一个assert True 的不精确断言


定义了一个用户注册的函数,这个函数能够成功执行,但是这个函数并没有去操作数据库,返回的对象也是空的。



现在我们编写一个测试,使用不精确断言:



这样,最后断言的结果是成功的,测试通过。但其实代码功能是不准确的,因为它压根没有去操作数据库,用户数据根本没有被保存。我们预期的是他要去操作数据库保存用户数据。


使用精确断言:


你要检查函数的返回值或对象的属性是否是你期望的那个确切的值。



这样 AI 就知道了,它不仅要创建用户,还必须正确地设置用户的 emailis_active 属性。


5)覆盖边界和失败


你思考的失败场景越全面,AI 生成的代码就越健壮。


总结来说, TDD 与 AI 协作,是用确定性来驾驭不确定性。它就像给一匹强大的野马套上了缰绳和马鞍,让你能够引导它的力量,去往你想去的方向,而不是被它带着到处乱跑。

发布于: 刚刚阅读数: 7
用户头像

【gzh:和平本记】 2018-06-23 加入

后端程序员。目标是做一个有才华,身上有光的男人。

评论

发布
暂无评论
AI 写代码总是乱?吴恩达力推的测试驱动开发(TDD),能帮你兜底_TDD_hepingfly【gzh:和平本记】_InfoQ写作社区