智能摘要

引言：代码审查的痛点与AI破局

在软件开发周期中，代码审查是保证质量的关键环节。但传统人工审查受限于时间、经验和注意力，常出现漏检、偏见或重复劳动。随着大语言模型（LLM）的成熟，尤其是LangChain框架的出现，构建一套自动化代码审查系统已成为现实。本文将从零开始，手把手带你用Python和LangChain打造一个能自动分析代码风格、检测逻辑错误、生成审查意见的智能工具。

一张展示<a href= — 一张展示代码审查系统界面截图，左侧是原始代码，右侧是AI生成的审查意见列表，色调为深蓝与白色，构图采用左右分栏式

核心架构设计

系统模块划分

代码采集模块：从Git仓库或本地文件读取代码
分析引擎：基于LangChain的链式调用，调用LLM进行代码解析
审查规则库：预定义的代码规范与反模式规则（如PEP8、安全漏洞）
输出报告生成器：将结果格式化为Markdown或JSON

系统采用模块化设计，便于扩展和定制。LangChain作为核心协调层，负责管理LLM调用、提示词模板和结果解析。

环境准备与依赖安装

pip install langchain langchain-community langchain-openai python-dotenv

需要OpenAI API密钥或其他兼容的LLM（如Ollama本地模型）。将密钥存入.env文件：

OPENAI_API_KEY=your_api_key_here

构建代码审查链

步骤1：定义审查提示词模板

提示词质量直接决定审查效果。我们设计一个多角度提示词：

from langchain.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一位资深代码审查专家。请分析以下代码，从以下维度给出反馈：n1. 代码风格（PEP8规范）n2. 潜在bug或逻辑错误n3. 安全漏洞（如SQL注入、XSS）n4. 性能优化建议n5. 可读性与维护性nn请用中文输出，格式为Markdown列表。"),
    ("human", "代码文件：{filename}nn```n{code}n```")
])

步骤2：创建审查链

from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.2)
chain = prompt | llm | StrOutputParser()

步骤3：集成代码读取功能

import os

def read_code(file_path):
    with open(file_path, 'r', encoding='utf-8') as f:
        return f.read()

def review_file(file_path):
    code = read_code(file_path)
    filename = os.path.basename(file_path)
    result = chain.invoke({"filename": filename, "code": code})
    return result

高级功能：批量审查与Git集成

批量审查目录

import glob

def review_directory(directory_path, extensions=['.py']):
    results = {}
    for ext in extensions:
        for file_path in glob.glob(f"{directory_path}/**/*{ext}", recursive=True):
            try:
                result = review_file(file_path)
                results[file_path] = result
                print(f"审查完成: {file_path}")
            except Exception as e:
                print(f"审查失败 {file_path}: {e}")
    return results

与Git提交挂钩

利用Git的pre-commit钩子，在每次提交前自动审查变更代码：

import subprocess

def get_changed_files():
    result = subprocess.run(['git', 'diff', '--cached', '--name-only'], capture_output=True, text=True)
    return result.stdout.strip().split('n')

将审查结果写入文件并阻止提交（如果严重问题存在）。

实际案例演示

假设我们有一个Python文件user_auth.py，内容如下：

def login(username, password):
    query = "SELECT * FROM users WHERE username='" + username + "' AND password='" + password + "'"
    cursor.execute(query)
    return cursor.fetchone()

运行审查后，系统会输出：