Chandra OCR实战案例：跨境电商报关单OCR→多语种字段结构化提取

本文介绍了如何利用星图GPU平台自动化部署Chandra OCR镜像，实现跨境电商报关单的智能识别与信息提取。该方案能高效处理多语种、复杂版面的报关单图片，通过布局感知技术精准提取商品、金额等关键字段，并输出结构化JSON数据，大幅提升报关数据处理效率与准确性。

毛心宇

26人浏览 · 2026-03-14 01:46:56

毛心宇 · 2026-03-14 01:46:56 发布

Chandra OCR实战案例：跨境电商报关单OCR→多语种字段结构化提取

1. 引言：从报关单的“头疼事”说起

如果你是做跨境电商的，或者处理过进出口物流，肯定对报关单不陌生。那一张张密密麻麻、格式各异、还经常是中英文混杂的表格，简直是数据录入员的噩梦。手动录入不仅效率低下，还容易出错，一个数字看错，可能就导致清关延误甚至产生罚款。

传统的OCR工具在这里常常“水土不服”。它们可能能识别出文字，但面对复杂的表格线、多栏布局、以及中英日韩等多语种混排时，结果往往是一团乱麻——文字顺序错乱，表格结构丢失，更别提把“商品名称”、“HS编码”、“数量”、“单价”这些关键字段精准地提取出来了。你得到的可能只是一堆需要人工二次整理的文本碎片。

今天要介绍的，就是专门解决这类“头疼事”的利器：Chandra OCR。它不是一个简单的文字识别工具，而是一个“布局感知”的OCR模型。简单说，它不仅能“看见”字，还能“看懂”文档的排版结构——哪里是标题，哪里是表格，表格有几行几列，每个单元格里是什么内容。

在本文中，我们将聚焦一个非常具体且高价值的场景：跨境电商报关单的自动化识别与结构化信息提取。我会手把手带你，利用基于vLLM加速的Chandra，搭建一个本地处理流水线，实现从上传报关单图片，到自动输出结构化JSON数据的全过程。你会发现，原来处理报关单可以如此高效和准确。

2. 为什么是Chandra？它强在哪里？

在开始动手之前，我们先快速了解一下Chandra的“过人之处”，明白为什么它适合处理报关单这种复杂文档。

一句话总结它的核心优势：4GB显存就能跑，在权威的olmOCR基准测试中综合得分超过83分，能一次性搞定表格、手写、公式，输出直接就是带结构的Markdown、HTML或JSON。

下面我们拆开看看几个关键点：

精度高，尤其擅长复杂版面：在olmOCR基准测试的8个子项中，Chandra平均得分83.1，其中在“老旧扫描件”、“数学公式”、“表格”和“长串小字”等项目上均位列第一。这意味着它对报关单常见的扫描件、密集表格有极强的识别能力。
真正的“布局感知”：这是Chandra与传统OCR最大的区别。它不会把文档当成一张普通的图片来识别文字，而是能理解文档的视觉层次结构。它能分辨出段落、标题、列表、表格，并保留它们的相对位置和嵌套关系。对于报关单，这意味着它能准确还原表格的网格结构，知道“商品编号”和“123456”属于同一个单元格。
多语种支持友好：官方验证支持超过40种语言，对中、英、日、韩、德、法、西等语言的表现最佳。跨境电商报关单经常是中英文混杂，甚至包含目的地国家的语言，Chandra可以很好地应对。
输出即结构，无缝衔接下游流程：Chandra的输出不是纯文本，而是直接生成Markdown、HTML或JSON格式。JSON格式尤其适合程序化处理，它包含了每个文本块的坐标、所属的章节或表格信息。这为我们后续的“字段结构化提取”打下了完美的基础——我们不再需要从一堆乱序的文字中“猜”结构，而是直接解析一个有明确标签和层级的数据树。
部署简单，成本低廉：模型采用Apache 2.0和OpenRAIL-M许可，商业友好。通过vLLM后端部署，可以充分利用GPU并行能力，单页识别平均只需1秒。更重要的是，它只需要约4GB的显存（例如一张RTX 3060）就能运行，让本地化部署成为可能。

所以，面对一张格式复杂、多语种的报关单，Chandra的工作流程是：图片/PDF → 识别文字并理解布局 → 生成带结构的JSON → 我们编写规则提取目标字段。接下来，我们就开始搭建这个流程。

3. 环境准备：基于vLLM本地部署Chandra

为了让处理速度更快，我们选择基于vLLM来部署Chandra。vLLM是一个高性能的LLM推理和服务引擎，能极大提升吞吐量。

3.1 基础环境与依赖安装

确保你的机器有一张NVIDIA显卡（显存建议8G以上，4G也可运行但可能限制批量大小），并安装了合适版本的CUDA。

首先，我们创建一个干净的Python环境（推荐使用conda或venv），然后安装核心依赖：

# 1. 创建并激活虚拟环境 (以conda为例)
conda create -n chandra_ocr python=3.10 -y
conda activate chandra_ocr

# 2. 安装PyTorch (请根据你的CUDA版本到PyTorch官网选择对应命令)
# 例如，对于CUDA 12.1
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# 3. 安装vLLM
pip install vllm

# 4. 安装Chandra OCR的核心库
pip install chandra-ocr

安装chandra-ocr这个包时，它会自动安装模型运行所需的其他依赖，如transformers, Pillow等。

3.2 启动vLLM服务端

Chandra的模型权重托管在Hugging Face上。我们可以使用vLLM的命令行工具，轻松地将模型作为一个API服务启动起来。

打开一个终端窗口（保持虚拟环境激活），执行以下命令：

# 启动vLLM服务，加载Chandra模型
# --model: 指定模型路径，这里使用官方模型
# --served-model-name: 服务名称，客户端会用到
# --max-model-len: 模型最大上下文长度，根据文档设置
# --tensor-parallel-size: 张量并行大小，如果你的GPU有多张卡，可以设置为卡数以加速
vllm serve \
  --model datalab-ai/chandra-1.0-ocr \
  --served-model-name chandra-ocr \
  --max-model-len 8192 \
  --tensor-parallel-size 1

参数解释：

--model datalab-ai/chandra-1.0-ocr: 指定要加载的模型。vLLM会自动从Hugging Face下载。
--served-model-name chandra-ocr: 给你的服务起个名字，后面客户端连接时会用到。
--max-model-len 8192: Chandra模型支持的最大序列长度，保持默认即可。
--tensor-parallel-size 1: 如果你只有一张GPU，就设为1。如果你有多张GPU，可以设为GPU数量以进行模型并行，加快推理速度。

执行命令后，vLLM会开始下载模型（首次运行需要一些时间），下载完成后你会看到类似下面的输出，表示服务已经在http://localhost:8000上运行：

INFO 07-10 10:00:00 llm_engine.py:197] Initializing an LLM engine (vLLM version 0.5.3)...
INFO 07-10 10:00:00 llm_engine.py:199] Engine args: ...
INFO 07-10 10:00:00 model_runner.py:543] Loading model weights...
...
Uvicorn running on http://localhost:8000 (Press CTRL+C to quit)

让这个终端窗口保持运行，不要关闭它。

3.3 编写客户端调用脚本

服务端在后台运行后，我们需要另一个Python脚本来充当客户端，向服务端发送图片并获取识别结果。

创建一个新的Python文件，例如chandra_client.py，并写入以下代码：

import requests
import base64
import json
import sys

def ocr_image_with_chandra(image_path, server_url="http://localhost:8000", output_format="json"):
    """
    调用本地vLLM服务的Chandra模型进行OCR识别。

    Args:
        image_path (str): 待识别图片的路径。
        server_url (str): vLLM服务地址。
        output_format (str): 输出格式，可选 'markdown', 'html', 'json'。
    Returns:
        dict: 识别结果。
    """
    # 1. 读取图片并编码为base64
    with open(image_path, "rb") as image_file:
        encoded_image = base64.b64encode(image_file.read()).decode('utf-8')

    # 2. 构造请求数据
    # Chandra通过特殊的“用户消息”格式接收图片和指令
    messages = [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {
                        "url": f"data:image/jpeg;base64,{encoded_image}"
                    }
                },
                {
                    "type": "text",
                    "text": f"请将图片中的内容识别为结构化的{output_format.upper()}格式。"
                }
            ]
        }
    ]

    payload = {
        "model": "chandra-ocr", # 必须与启动服务时的 --served-model-name 一致
        "messages": messages,
        "max_tokens": 8192, # 最大生成token数
        "temperature": 0.1, # 温度参数，越低输出越确定
    }

    # 3. 发送请求到vLLM服务
    try:
        response = requests.post(f"{server_url}/v1/chat/completions", json=payload)
        response.raise_for_status()  # 检查HTTP错误
        result = response.json()
    except requests.exceptions.RequestException as e:
        print(f"请求API失败: {e}")
        return None
    except json.JSONDecodeError as e:
        print(f"解析响应JSON失败: {e}")
        return None

    # 4. 提取模型返回的内容
    # Chandra的回复在 choices[0].message.content 中
    ocr_result_text = result.get("choices", [{}])[0].get("message", {}).get("content", "")
    
    # 如果输出格式是JSON，尝试解析它
    if output_format.lower() == "json":
        try:
            # Chandra返回的JSON是包裹在文本中的，需要提取并解析
            # 通常它以 ```json 开头和结尾
            if "```json" in ocr_result_text:
                json_str = ocr_result_text.split("```json")[1].split("```")[0].strip()
            elif "```" in ocr_result_text:
                json_str = ocr_result_text.split("```")[1].split("```")[0].strip()
            else:
                json_str = ocr_result_text.strip()
            return json.loads(json_str)
        except json.JSONDecodeError as e:
            print(f"解析OCR返回的JSON失败，原始文本为:\n{ocr_result_text[:500]}...")
            return {"raw_output": ocr_result_text}
    else:
        # 对于Markdown或HTML，直接返回文本
        return ocr_result_text

if __name__ == "__main__":
    # 使用示例
    if len(sys.argv) < 2:
        print("用法: python chandra_client.py <图片路径> [输出格式: json/markdown/html]")
        sys.exit(1)
    
    image_path = sys.argv[1]
    output_format = sys.argv[2] if len(sys.argv) > 2 else "json"
    
    print(f"正在处理图片: {image_path}， 输出格式: {output_format}")
    result = ocr_image_with_chandra(image_path, output_format=output_format)
    
    if result:
        # 将结果保存到文件
        output_file = f"{image_path}_result.{output_format}"
        if output_format == "json":
            with open(output_file, 'w', encoding='utf-8') as f:
                json.dump(result, f, ensure_ascii=False, indent=2)
        else:
            with open(output_file, 'w', encoding='utf-8') as f:
                f.write(result)
        print(f"识别完成！结果已保存至: {output_file}")
        # 同时在控制台打印JSON的摘要（例如，前几个键）
        if isinstance(result, dict):
            print("\n--- 识别结果摘要 (JSON结构) ---")
            print(json.dumps(result, ensure_ascii=False, indent=2)[:1000]) # 只打印前1000字符避免刷屏
    else:
        print("识别失败。")

这个脚本做了几件事：

读取你指定的图片文件，并转换成base64编码。
构造一个符合vLLM API格式的请求，其中包含了图片数据和“请输出JSON”的指令。
将请求发送到我们本地启动的http://localhost:8000服务。
接收返回结果，并尝试解析出纯净的JSON数据（因为模型返回的文本可能包含Markdown代码块标记）。
将最终的结构化结果保存为文件，并打印一部分到控制台供预览。

4. 实战：报关单信息结构化提取

现在，我们有了一个强大的OCR引擎。接下来，我们要针对“报关单”这个特定文档类型，编写逻辑从Chandra输出的通用JSON结构中，提取出我们关心的业务字段。

4.1 理解Chandra的输出结构

首先，我们找一张简单的报关单图片（可以是脱敏的样例），用上面的脚本跑一下，看看Chandra究竟输出了什么。

假设我们处理了一张报关单，得到的JSON结构可能如下（这是一个高度简化的示例，实际结构更丰富）：

{
  "type": "document",
  "children": [
    {
      "type": "section",
      "metadata": {"role": "title"},
      "children": [
        {"type": "paragraph", "text": "COMMERCIAL INVOICE", "bbox": [50, 100, 400, 130]}
      ]
    },
    {
      "type": "table",
      "bbox": [50, 150, 550, 400],
      "children": [
        {
          "type": "table_row",
          "children": [
            {"type": "table_cell", "text": "Item No.", "bbox": [50, 150, 150, 180]},
            {"type": "table_cell", "text": "Description of Goods", "bbox": [150, 150, 350, 180]},
            {"type": "table_cell", "text": "Quantity", "bbox": [350, 150, 450, 180]},
            {"type": "table_cell", "text": "Unit Price (USD)", "bbox": [450, 150, 550, 180]}
          ]
        },
        {
          "type": "table_row",
          "children": [
            {"type": "table_cell", "text": "1", "bbox": [50, 180, 150, 210]},
            {"type": "table_cell", "text": "Wireless Bluetooth Headphone", "bbox": [150, 180, 350, 210]},
            {"type": "table_cell", "text": "100", "bbox": [350, 180, 450, 210]},
            {"type": "table_cell", "text": "25.50", "bbox": [450, 180, 550, 210]}
          ]
        }
      ]
    },
    {
      "type": "section",
      "children": [
        {"type": "paragraph", "text": "Total Amount: USD 2550.00", "bbox": [400, 420, 550, 450]}
      ]
    }
  ]
}

关键点解析：

树形结构：整个文档是一个树（type: document），包含子节点（children）。
元素类型：有section（区域）、paragraph（段落）、table（表格）、table_row（行）、table_cell（单元格）等类型。
文本与坐标：每个叶子节点（如paragraph, table_cell）都包含text（识别出的文字）和bbox（边界框坐标[x1, y1, x2, y2]）。
表格结构：表格被完美地重建为table -> table_row -> table_cell的层级，这为我们按行按列提取数据提供了极大便利。

4.2 设计字段提取逻辑

我们的目标是提取如“发货人”、“收货人”、“商品列表”、“总金额”等字段。由于报关单格式多样，一个健壮的提取器需要结合多种策略：

关键词定位：对于位置相对固定的字段（如标题“COMMERCIAL INVOICE”），可以通过遍历所有paragraph节点，寻找包含特定关键词（如“Invoice No.”, “Shipper”）的文本块，然后根据其坐标，在附近寻找对应的值。
表格解析：对于商品清单，直接定位type为table的节点。将表格解析为二维数据结构（列表的列表），第一行通常是表头。我们可以通过匹配表头文字（如“Description”, “QTY”）来确定哪一列是我们需要的数据。
坐标关联：对于格式固定的单据，可以基于bbox坐标建立规则。例如，如果知道“总金额”总出现在右下角某个区域，可以直接提取该区域内的文本。

下面是一个示例提取函数，它演示了如何从上述JSON中提取商品清单和总金额：

import json

def extract_customs_declaration_info(ocr_json_result):
    """
    从Chandra OCR的JSON结果中提取报关单关键信息。
    这是一个示例函数，需要根据实际报关单格式调整。
    """
    extracted_info = {
        "invoice_number": None,
        "shipper": None,
        "consignee": None,
        "items": [],
        "total_amount": None
    }
    
    def traverse(node):
        """递归遍历JSON树"""
        if not isinstance(node, dict):
            return
        
        node_type = node.get("type")
        text = node.get("text", "").strip()
        bbox = node.get("bbox", [])
        children = node.get("children", [])
        
        # 策略1：关键词匹配（用于查找非表格字段）
        if node_type == "paragraph":
            text_lower = text.lower()
            # 这里可以添加更多关键词匹配逻辑
            if "invoice no" in text_lower or "invoice number" in text_lower:
                # 简单示例：假设编号就在这个段落文本里，用冒号或空格分割
                parts = text.split(':')
                if len(parts) > 1:
                    extracted_info["invoice_number"] = parts[-1].strip()
                else:
                    extracted_info["invoice_number"] = text.replace("Invoice No.", "").replace("INVOICE NUMBER", "").strip()
            elif "total" in text_lower and ("usd" in text_lower or "$" in text):
                # 提取总金额，这里使用简单的正则或字符串查找，实际应用可能需要更复杂的解析
                import re
                amount_match = re.search(r'[\d,]+\.?\d*', text)
                if amount_match:
                    extracted_info["total_amount"] = amount_match.group()
        
        # 策略2：表格解析（用于提取商品清单）
        elif node_type == "table":
            print(f"发现表格，位置: {bbox}")
            # 将表格结构转换为二维列表
            table_data = []
            for row in children:
                if row.get("type") == "table_row":
                    row_data = []
                    for cell in row.get("children", []):
                        if cell.get("type") == "table_cell":
                            row_data.append(cell.get("text", "").strip())
                    if row_data: # 忽略空行
                        table_data.append(row_data)
            
            if table_data:
                print(f"解析到表格数据，共{len(table_data)}行:")
                for r in table_data:
                    print(r)
                
                # 假设第一行是表头
                headers = table_data[0]
                # 寻找目标列索引
                item_desc_idx = -1
                qty_idx = -1
                price_idx = -1
                
                for i, header in enumerate(headers):
                    header_lower = header.lower()
                    if "desc" in header_lower:
                        item_desc_idx = i
                    elif "qty" in header_lower or "quantity" in header_lower:
                        qty_idx = i
                    elif "price" in header_lower or "unit" in header_lower:
                        price_idx = i
                
                # 从数据行提取商品信息
                for data_row in table_data[1:]: # 跳过表头
                    if len(data_row) > max(item_desc_idx, qty_idx, price_idx, 0):
                        item = {
                            "description": data_row[item_desc_idx] if item_desc_idx != -1 else "",
                            "quantity": data_row[qty_idx] if qty_idx != -1 else "",
                            "unit_price": data_row[price_idx] if price_idx != -1 else ""
                        }
                        # 简单的有效性检查，避免空行
                        if item["description"]:
                            extracted_info["items"].append(item)
        
        # 递归处理子节点
        for child in children:
            traverse(child)
    
    # 开始遍历
    traverse(ocr_json_result)
    return extracted_info

# 使用示例
if __name__ == "__main__":
    # 假设ocr_result是从chandra_client.py保存的JSON文件加载的
    with open('你的报关单图片_result.json', 'r', encoding='utf-8') as f:
        ocr_data = json.load(f)
    
    info = extract_customs_declaration_info(ocr_data)
    print("\n=== 提取的报关单信息 ===")
    print(json.dumps(info, ensure_ascii=False, indent=2))

这个函数展示了核心思路：遍历OCR结果树，根据节点类型和内容，应用不同的规则提取信息。对于真实的项目，你需要根据你所处理的报关单的具体版式，来丰富和完善这个提取逻辑。

4.3 构建完整处理流水线

现在，我们将所有步骤串联起来，形成一个完整的自动化流水线脚本pipeline.py：

import os
import json
from chandra_client import ocr_image_with_chandra # 导入之前写的客户端函数
from extraction_logic import extract_customs_declaration_info # 导入字段提取函数

def process_customs_invoice(image_folder, output_folder):
    """
    批量处理报关单图片文件夹。
    """
    os.makedirs(output_folder, exist_ok=True)
    
    supported_extensions = ('.png', '.jpg', '.jpeg', '.bmp', '.tiff', '.pdf')
    
    for filename in os.listdir(image_folder):
        if filename.lower().endswith(supported_extensions):
            image_path = os.path.join(image_folder, filename)
            print(f"\n{'='*50}")
            print(f"处理文件: {filename}")
            
            # 步骤1: 调用Chandra OCR
            print("步骤1: 调用OCR引擎...")
            ocr_json_result = ocr_image_with_chandra(image_path, output_format="json")
            
            if not ocr_json_result:
                print(f"  OCR处理失败: {filename}")
                continue
                
            # 保存原始OCR结果
            raw_output_path = os.path.join(output_folder, f"{os.path.splitext(filename)[0]}_raw.json")
            with open(raw_output_path, 'w', encoding='utf-8') as f:
                json.dump(ocr_json_result, f, ensure_ascii=False, indent=2)
            print(f"  原始OCR结果已保存: {raw_output_path}")
            
            # 步骤2: 提取结构化信息
            print("步骤2: 提取关键字段...")
            extracted_info = extract_customs_declaration_info(ocr_json_result)
            
            # 保存结构化结果
            structured_output_path = os.path.join(output_folder, f"{os.path.splitext(filename)[0]}_extracted.json")
            with open(structured_output_path, 'w', encoding='utf-8') as f:
                json.dump(extracted_info, f, ensure_ascii=False, indent=2)
            print(f"  结构化信息已保存: {structured_output_path}")
            print(f"  提取到 {len(extracted_info.get('items', []))} 条商品记录。")
            
    print(f"\n{'='*50}")
    print("批量处理完成！")

if __name__ == "__main__":
    # 配置你的输入输出文件夹路径
    input_folder = "./customs_invoices"
    output_folder = "./processed_results"
    
    process_customs_invoice(input_folder, output_folder)

这个流水线实现了：

批量处理：自动扫描文件夹内的所有图片和PDF。
两步走：先OCR获得带结构的JSON，再从中提取业务字段。
结果保存：同时保存原始的详细OCR结果和最终的结构化数据，方便核对和调试。

5. 总结与展望

通过本文的实战演练，我们完成了一个从0到1的搭建过程，利用Chandra OCR和vLLM，构建了一个针对跨境电商报关单的本地化、结构化信息提取系统。

回顾一下核心步骤和优势：

精准识别是基础：Chandra的“布局感知”能力，将杂乱无章的报关单图片，转换成了层次分明、结构清晰的JSON数据树。这彻底解决了传统OCR在复杂版式和多语种混排下的识别乱序问题。
本地部署保安全：基于vLLM在本地部署模型，所有敏感的商业单据数据无需上传至云端，满足了企业对数据隐私和安全的高要求。RTX 3060级别的显卡即可流畅运行，成本可控。
规则提取变智能：我们基于OCR输出的结构化数据，编写了针对性的字段提取逻辑。这种方法比直接处理图片或纯文本要可靠和高效得多，因为数据已经有了“上下文”和“归属”。
流程自动化提效率：将OCR调用和规则提取封装成流水线，可以实现报关单的批量自动处理，将人力从繁琐的录入工作中解放出来，效率提升可达数十倍。

未来的优化方向：

提取规则强化：当前的提取逻辑是基于规则的。对于格式多变的单据，可以结合机器学习模型（如序列标注模型）来识别和分类字段，使其更具泛化能力。
与业务系统集成：将提取出的结构化数据（JSON），通过API自动对接到企业的ERP、WMS或报关系统中，实现全流程无人化。
处理更多单据类型：同样的技术栈可以轻松扩展到发票、提单、箱单、身份证、营业执照等各种文档的自动化识别与信息提取场景。

Chandra OCR的出现，显著降低了高质量文档智能解析的门槛。它提供的不仅是文字，更是理解和结构。对于有大量文档处理需求的企业和个人开发者来说，将其融入自动化流程，无疑是提升效率和准确性的强大助推器。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

快递鸟一站式物流API解决方案

电商企业物流数字化转型必备！快递鸟 API 接口，72 小时快速完成物流系统集成。全流程实战1V1指导，营造开放的API技术生态圈。

更多推荐

苹方字体跨平台解决方案：告别Windows与Mac的字体显示鸿沟

在Web开发中，我们经常面临一个令人头疼的问题：精心设计的页面在Mac上优雅精致，到了Windows设备上却因字体差异而显得平庸。今天，我们为您介绍一个专业的解决方案——PingFangSC字体包，它让苹方字体的优雅设计能够在所有平台上完美呈现。这个开源项目提供了完整的6种字重，支持ttf和woff2双格式，真正实现了跨平台字体统一。## 为什么跨平台字体一致性如此重要？🔍现代Web应用

快递鸟社区

Ascend-SACT/Mineru-Optimization后端引擎对比：Pipeline、Hybrid与VLM模式如何选择？

Ascend-SACT/Mineru-Optimization提供三种强大的后端引擎模式——Pipeline、Hybrid和VLM，帮助用户高效处理各类文档。本文将深入对比这三种模式的核心特性、性能表现和适用场景，助你快速找到最适合的解决方案。## 三大引擎模式核心特性解析 🚀### Pipeline模式：传统OCR流程的极致优化**核心架构**：采用模块化设计，包含版面分析、OCR、

快递鸟社区

如何永久保存微信聊天记录？WeChatMsg免费开源工具终极指南

你是否曾担心更换手机后，那些珍贵的微信对话会永远消失？与家人的温馨聊天、重要的工作沟通、朋友间的难忘回忆，这些数字记忆都值得被永久珍藏。**WeChatMsg**是一款完全免费的开源工具，专门用于**微信聊天记录永久保存和深度分析**，让你的每一段对话都能成为永恒的数字资产。## 🔍 你的聊天记录正在面临什么风险？微信已经成为我们日常生活中不可或缺的沟通工具，但官方并未提供完整的聊天记录