XHS Downloader

小红书（XiaoHongShu、RedNote）链接提取/作品采集工具：提取账号发布、收藏、点赞、专辑作品链接；提取搜索结果作品、用户链接；采集小红书作品信息；提取小红书作品下载地址；下载小红书无水印作品文件

JoeanAmier

8108

1190

Python

XHS-Downloader

简体中文 | English

🔥 小红书链接提取/作品采集工具：提取账号发布、收藏、点赞、专辑作品链接；提取搜索结果作品链接、用户链接；采集小红书作品信息；提取小红书作品下载地址；下载小红书无水印作品文件！

🔥 “小红书”、“XiaoHongShu”、“RedNote” 含义相同，本项目统称为 “小红书”

⭐ 本项目完全免费开源，无任何收费功能，请勿上当受骗！

📑 项目功能

程序功能

✅ 采集小红书作品信息
✅ 提取小红书作品下载地址
✅ 下载小红书无水印作品文件
✅ 下载小红书 livePhoto 文件(非无水印)
✅ 自动跳过已下载的作品文件
✅ 作品文件完整性处理机制
✅ 自定义图文作品文件下载格式
✅ 持久化储存作品信息至文件
✅ 作品文件储存至单独文件夹
✅ 后台监听剪贴板下载作品
✅ 记录已下载作品 ID
✅ 支持命令行下载作品文件
✅ 从浏览器读取 Cookie
✅ 自定义文件名称格式
✅ 支持 API 调用功能
✅ 支持文件断点续传下载
✅ 智能识别作品文件类型
✅ 支持设置作者备注
✅ 自动更新作者昵称

脚本功能

✅ 下载小红书无水印作品文件
✅ 提取推荐页面作品链接
✅ 提取账号发布作品链接
✅ 提取账号收藏作品链接
✅ 提取账号点赞作品链接
✅ 提取账号专辑作品链接
✅ 提取搜索结果作品链接
✅ 提取搜索结果用户链接

⭐ XHS-Downloader 开发计划及进度可前往 Projects 查阅

📸 程序截图

🎥 点击图片观看演示视频

🔗 支持链接

https://www.xiaohongshu.com/explore/作品ID?xsec_token=XXX
https://www.xiaohongshu.com/discovery/item/作品ID?xsec_token=XXX
https://xhslink.com/分享码

支持单次输入多个作品链接，链接之间使用空格分隔；程序会自动提取有效链接，无需额外处理！

🪟 关于终端

⭐ 推荐使用 Windows 终端（Windows 11 默认终端）运行程序以便获得最佳显示效果！

🥣 使用方法

如果仅需下载无水印作品文件，建议选择 程序运行 或 Docker 运行；如果有其他需求，建议选择 源码运行！

2.2 版本开始，项目功能无异常的情况下，无需额外处理 Cookie！

🖱 程序运行

⭐ Mac OS、Windows 10 及以上用户可前往 Releases 或者 Actions 下载程序压缩包，解压后打开程序文件夹，双击运行 main 即可使用。

⭐ 本项目包含自动构建可执行文件的 GitHub Actions，使用者可以随时使用 GitHub Actions 将最新源码构建为可执行文件！

⭐ 自动构建可执行文件教程请查阅本文档的 构建可执行文件指南 部分；如果需要更加详细的图文教程，请查阅文章！

注意：Mac OS 平台可执行文件 main 可能需要从终端命令行启动；受设备限制，Mac OS 平台可执行文件尚未经过测试，无法保证可用性！

若通过此方式使用程序，文件默认下载路径为：.\_internal\Download；配置文件路径为：.\_internal\settings.json

⌨️ Docker 运行

获取镜像

方式一：使用 Dockerfile 文件构建镜像
方式二：使用 docker pull joeanamier/xhs-downloader 命令拉取镜像
方式三：使用 docker pull ghcr.io/joeanamier/xhs-downloader 命令拉取镜像

创建容器

TUI 模式：docker run --name 容器名称(可选) -p 主机端口号:5556 -v xhs_downloader_volume:/app -it joeanamier/xhs-downloader
API 模式：docker run --name 容器名称(可选) -p 主机端口号:5556 -v xhs_downloader_volume:/app -it joeanamier/xhs-downloader python main.py server

运行容器
- 启动容器：docker start -i 容器名称/容器 ID
- 重启容器：docker restart -i 容器名称/容器 ID

Docker 运行项目时不支持 命令行调用模式，无法使用 读取剪贴板 与 监听剪贴板 功能，可以正常粘贴内容，其他功能如有异常请反馈！

⌨️ 源码运行

安装版本号为 3.12 的 Python 解释器
下载本项目最新的源码或 Releases 发布的源码至本地
打开终端，切换至项目根路径
运行 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt 命令安装程序所需模块
运行 main.py 即可使用

🛠 命令行模式

项目支持命令行运行模式，若想要下载图文作品的部分图片，可以使用此模式设置需要下载的图片序号！

可以使用命令行 从浏览器读取 Cookie 并写入配置文件！

命令示例：python .\main.py --browser_cookie Chrome --update_settings

bool 类型参数支持使用 true、false、1、0、yes、no、on 或 off（不区分大小写）来设置。

🖥 服务器模式

启动：运行命令：python .\main.py server

关闭：按下 Ctrl + C 关闭服务器

访问 http://127.0.0.1:5556/docs 或者 http://127.0.0.1:5556/redoc；你会看到自动生成的交互式 API 文档！

请求接口：/xhs/

请求方法：POST

请求格式：JSON

请求参数：

参数	类型	含义	默认值
url	str	小红书作品链接，自动提取，不支持多链接；必需参数	无
download	bool	是否下载作品文件；设置为 `true` 将会耗费更多时间；可选参数	false
index	list[int]	下载指定序号的图片文件，仅对图文作品生效；`download` 参数设置为 `false` 时不生效；可选参数	null
cookie	str	请求数据时使用的 Cookie；可选参数	配置文件 cookie 参数
proxy	str	请求数据时使用的代理；可选参数	配置文件 proxy 参数
skip	bool	是否跳过存在下载记录的作品；设置为 `true` 将不会返回存在下载记录的作品数据；可选参数	false

代码示例：

async def example_api():
    """通过 API 设置参数，适合二次开发"""
    server = "http://127.0.0.1:5556/xhs/"
    data = {
        "url": "",  # 必需参数
        "download": True,
        "index": [
            3,
            6,
            9,
        ],
        "proxy": "http://127.0.0.1:10808",
    }
    response = post(server, json=data, timeout=10)
    print(response.json())

📜 其他说明

由于作品链接携带日期信息，使用先前日期获取的作品链接可能会被风控，建议下载作品文件时使用最新获取的作品链接
Windows 系统需要以管理员身份运行程序才能读取 Chromium、Chrome、Edge 浏览器 Cookie
如果开启保存作品数据至文件功能，作品数据默认储存至 ./Download/ExploreData.db 文件
程序下载记录数据储存至 ./ExploreID.db 文件

🕹 用户脚本

如果您的浏览器安装了 Tampermonkey 浏览器扩展程序，可以添加用户脚本(右键单击复制链接)，无需下载安装即可体验项目功能！

提示：使用 XHS-Downloader 用户脚本批量提取作品链接，搭配 XHS-Downloader 程序可以实现批量下载无水印作品文件！

📜 脚本说明

下载小红书无水印作品文件时，脚本需要花费时间处理文件，请等待片刻，请勿多次点击下载按钮
无水印图片文件为 PNG 格式；无水印视频文件较大，可能需要较长的时间处理，页面跳转可能会导致下载失败
提取账号发布、收藏、点赞、专辑作品链接时，脚本可以自动滚动页面直至加载全部作品
提取推荐作品链接、搜索作品、用户链接时，脚本可以自动滚动指定次数加载更多内容，默认滚动次数：50 次
自动滚动页面功能默认关闭；用户可以自由开启，并修改滚动页面次数，修改后立即生效
如果未开启自动滚动页面功能，用户需要手动滚动页面以便加载更多内容后再进行其他操作
支持作品文件打包下载；该功能默认开启，多个文件的作品将会以压缩包格式下载
使用全局代理工具可能会导致脚本下载文件失败，如有异常，请尝试关闭代理工具，必要时向作者反馈
XHS-Downloader 用户脚本仅实现可见即可得的数据采集功能，无任何收费功能和破解功能

自动滚动页面功能代码已重构，该功能默认关闭！启用该功能可能会被小红书检测为自动化操作，从而导致账号受到风控或封禁风险！

💻 二次开发

如果有其他需求，可以根据 example.py 的注释提示进行代码调用或修改！

async def example():
    """通过代码设置参数，适合二次开发"""
    # 示例链接
    demo_link = "https://www.xiaohongshu.com/explore/XXX?xsec_token=XXX"
# 实例对象
work_path = "D:\\"  # 作品数据/文件保存根路径，默认值：项目根路径
folder_name = "Download"  # 作品文件储存文件夹名称（自动创建），默认值：Download
name_format = "作品标题 作品描述"
user_agent = ""  # User-Agent
cookie = ""  # 小红书网页版 Cookie，无需登录，可选参数，登录状态对数据采集有影响
proxy = None  # 网络代理
timeout = 5  # 请求数据超时限制，单位：秒，默认值：10
chunk = 1024 * 1024 * 10  # 下载文件时，每次从服务器获取的数据块大小，单位：字节
max_retry = 2  # 请求数据失败时，重试的最大次数，单位：秒，默认值：5
record_data = False  # 是否保存作品数据至文件
image_format = "WEBP"  # 图文作品文件下载格式，支持：AUTO、PNG、WEBP、JPEG、HEIC
folder_mode = False  # 是否将每个作品的文件储存至单独的文件夹
image_download = True  # 图文作品文件下载开关
video_download = True  # 视频作品文件下载开关
live_download = False  # 图文动图文件下载开关
download_record = True  # 是否记录下载成功的作品 ID
language = "zh_CN"  # 设置程序提示语言
author_archive = True  # 是否将每个作者的作品存至单独的文件夹
write_mtime = True  # 是否将作品文件的 修改时间 修改为作品的发布时间
read_cookie = None  # 读取浏览器 Cookie，支持设置浏览器名称（字符串）或者浏览器序号（整数），设置为 None 代表不读取

# async with XHS() as xhs:
#     pass  # 使用默认参数

async with XHS(
    work_path=work_path,
    folder_name=folder_name,
    name_format=name_format,
    user_agent=user_agent,
    cookie=cookie,
    proxy=proxy,
    timeout=timeout,
    chunk=chunk,
    max_retry=max_retry,
    record_data=record_data,
    image_format=image_format,
    folder_mode=folder_mode,
    image_download=image_download,
    video_download=video_download,
    live_download=live_download,
    download_record=download_record,
    language=language,
    read_cookie=read_cookie,
    author_archive=author_archive,
    write_mtime=write_mtime,
) as xhs:  # 使用自定义参数
    download = True  # 是否下载作品文件，默认值：False
    # 返回作品详细信息，包括下载地址
    # 获取数据失败时返回空字典
    print(
        await xhs.extract(
            demo_link,
            download,
            index=[
                1,
                2,
                5,
            ],
        )
    )

📋 读取剪贴板

项目使用 pyperclip 实现读取剪贴板功能，该模块在不同的系统上会有差异。

在 Windows 上，不需要额外的模块。

在 Mac 上，该模块使用 pbcopy 和 pbpaste 命令，这些命令应该随操作系统一起提供。

在 Linux 上，该模块使用 xclip 或 xsel 命令，这些命令应该随操作系统一起提供。否则，请运行 "sudo apt-get install xclip" 或 "sudo apt-get install xsel"（注意：xsel 似乎并不总是有效）

在其他 Linux 系统上，你需要安装 qtpy 或 PyQT5 模块。

⚙️ 配置文件

项目根目录下的 settings.json 文件，首次运行自动生成，可以自定义部分运行参数。

如果设置了无效的参数值，程序将会使用参数默认值！

参数	类型	含义	默认值
mapping_data	str: str	^#作者别名映射表，格式：`作者ID: 作者别名`	无
work_path	str	作品数据 / 文件保存根路径	项目根路径
folder_name	str	作品文件储存文件夹名称	Download
name_format	str	作品文件名称格式，字段之间使用空格分隔，支持字段：`收藏数量`、`评论数量`、`分享数量`、`点赞数量`、`作品标签`、`作品ID`、`作品标题`、`作品描述`、`作品类型`、`发布时间`、`最后更新时间`、`作者昵称`、`作者ID`	`发布时间作者昵称作品标题`
user_agent	str	浏览器 User Agent	内置 Chrome User Agent
cookie	str	小红书网页版 Cookie，无需登录，非必需参数！	无
proxy	str	设置程序代理	null
timeout	int	请求数据超时限制，单位：秒	10
chunk	int	下载文件时，每次从服务器获取的数据块大小，单位：字节	2097152(2 MB)
max_retry	int	请求数据失败时，重试的最大次数，单位：秒	5
record_data	bool	是否保存作品数据至文件，保存格式：`SQLite`	false
image_format	str	图文作品文件下载格式，支持：`AUTO`、`PNG`、`WEBP`、`JPEG`、`HEIC` 部分作品没有 `HEIC` 格式的文件，此时下载的文件可能为 `WEBP` 格式！设置为 `AUTO` 时表示动态格式，实际格式取决于服务器响应数据！	PNG
image_download	bool	图文作品文件下载开关	true
video_download	bool	视频作品文件下载开关	true
live_download	bool	图文动图文件下载开关	false
folder_mode	bool	是否将每个作品的文件储存至单独的文件夹；文件夹名称与文件名称保持一致	false
download_record	bool	是否记录下载成功的作品 ID，如果开启，程序将会自动跳过下载存在记录的作品	true
author_archive	bool	^#是否将每个作者的作品储存至单独的文件夹；文件夹名称为 `作者ID_作者昵称`	false
write_mtime	bool	是否将作品文件的 `修改时间` 属性修改为作品的发布时间	false
language	str	设置程序语言，目前支持：`zh_CN`、`en_US`	zh_CN

如果 author_archive 参数设置为 true，程序会把每个作者的作品储存至单独的文件夹；当作者的昵称发生变化时，程序会自动更新已下载作品文件名称中的作者昵称部分！

除此之外，你还可以通过设置 mapping_data 参数为某个作者设置别名；如果对某个作者设置了别名，程序会使用你设置的作者别名去替代作者昵称！

其他说明：user_agent参数获取示例；强烈建议根据实际浏览器信息进行设置！

🌐 Cookie

2.2 版本开始，项目功能无异常的情况下，无需额外处理 Cookie！

打开浏览器（可选无痕模式启动），访问 https://www.xiaohongshu.com/explore
登录小红书账号（可跳过）
按下 F12 打开开发人员工具
选择 网络 选项卡
勾选 保留日志
在 过滤 输入框输入 cookie-name:web_session
选择 Fetch/XHR 筛选器
点击小红书页面任意作品
在 网络 选项卡选择任意数据包（如果无数据包，重复步骤7）
全选复制 Cookie 写入程序或配置文件

🗳 下载记录

XHS-Downloader 会将下载过的作品 ID 储存至数据库，当重复下载相同的作品时，XHS-Downloader 会自动跳过该作品的文件下载（即使作品文件不存在），如果想要重新下载作品文件，请先删除数据库中对应的作品 ID，再使用 XHS-Downloader 下载作品文件！

该功能默认开启，如果关闭该功能，XHS-Downloader 会检查文件是否存在，若文件存在则跳过下载！

📦 构建可执行文件指南

本指南将引导您通过 Fork 本仓库并执行 GitHub Actions 自动完成基于最新源码的程序构建和打包！

使用步骤

1. Fork 本仓库

点击项目仓库右上角的 Fork 按钮，将本仓库 Fork 到您的个人 GitHub 账户中
您的 Fork 仓库地址将类似于：https://github.com/your-username/this-repo

2. 启用 GitHub Actions

前往您 Fork 的仓库页面
点击顶部的 Settings 选项卡
点击右侧的 Actions 选项卡
点击 General 选项
在 Actions permissions 下，选择 Allow all actions and reusable workflows 选项，点击 Save 按钮

3. 手动触发打包流程

在您 Fork 的仓库中，点击顶部的 Actions 选项卡
找到名为 构建可执行文件 的工作流
点击右侧的 Run workflow 按钮：
- 选择 master 或者 develop 分支
- 点击 Run workflow

4. 查看打包进度

在 Actions 页面中，您可以看到触发的工作流运行记录
点击运行记录，查看详细的日志以了解打包进度和状态

5. 下载打包结果

打包完成后，进入对应的运行记录页面
在页面底部的 Artifacts 部分，您将看到打包的结果文件
点击下载并保存到本地，即可获得打包好的程序

注意事项

资源使用：
- Actions 的运行环境由 GitHub 免费提供，普通用户每月有一定的免费使用额度（2000 分钟）
代码修改：
- 您可以自由修改 Fork 仓库中的代码以定制程序打包流程
- 修改后重新触发打包流程，您将得到自定义的构建版本
与主仓库保持同步：
- 如果主仓库更新了代码或工作流，建议您定期同步 Fork 仓库以获取最新功能和修复

Actions 常见问题

Q1: 为什么我无法触发工作流？

A: 请确认您已按照步骤 启用 Actions，否则 GitHub 会禁止运行工作流

Q2: 打包流程失败怎么办？

检查运行日志，了解失败原因
确保代码没有语法错误或依赖问题
如果问题仍未解决，可以在本仓库的 Issues 页面提出问题

Q3: 我可以直接使用主仓库的 Actions 吗？

A: 由于权限限制，您无法直接触发主仓库的 Actions。请通过 Fork 仓库的方式执行打包流程

⭐ Star 趋势

♥️ 支持项目

如果 XHS-Downloader 对您有帮助，请考虑为它点个 Star ⭐，感谢您的支持！

微信(WeChat)	支付宝(Alipay)

如果您愿意，可以考虑提供资助为 XHS-Downloader 提供额外的支持！

🌟 贡献指南

欢迎对本项目做出贡献！为了保持代码库的整洁、高效和易于维护，请仔细阅读以下指南，以确保您的贡献能够顺利被接受和整合。

在开始开发前，请从 develop 分支拉取最新的代码，以此为基础进行修改；这有助于避免合并冲突并保证您的改动基于最新的项目状态。
如果您的更改涉及多个不相关的功能或问题，请将它们分成多个独立的提交或拉取请求。
每个拉取请求应尽可能专注于单一功能或修复，以便于代码审查和测试。
遵循现有的代码风格；请确保您的代码与项目中已有的代码风格保持一致；建议使用 Ruff 工具保持代码格式规范。
编写可读性强的代码；添加适当的注释帮助他人理解您的意图。
每个提交都应该包含一个清晰、简洁的提交信息，以描述所做的更改。提交信息应遵循以下格式：<类型>: <简短描述>
当您准备提交拉取请求时，请优先将它们提交到 develop 分支；这是为了给维护者一个缓冲区，在最终合并到 master 分支之前进行额外的测试和审查。
建议在开发前或遇到疑问时与作者沟通，确保开发方向一致，避免重复劳动或无效提交。

参考资料：

✉️ 联系作者

作者邮箱：[email protected]
作者微信: Downloader_Tools
微信公众号: Downloader Tools
Discord 社区: 点击加入社区
QQ 群聊: 扫码加入群聊

说明：QQ 群聊仅限于讨论项目使用问题，严禁发布任何广告，严禁讨论任何账号交易、账号流量、流量变现、灰色产业等相关的内容！

✨ 作者的其他开源项目：

DouK-Downloader（抖音、TikTok）：https://github.com/JoeanAmier/TikTokDownloader
KS-Downloader（快手、KuaiShou）：https://github.com/JoeanAmier/KS-Downloader

💰 项目赞助

JetBrains 工具

JetBrains 支持全球开源社区认可的活跃项目，并为非商业开发提供免费许可证。

DartNode

⚠️ 免责声明

使用者对本项目的使用由使用者自行决定，并自行承担风险。作者对使用者使用本项目所产生的任何损失、责任、或风险概不负责。
本项目的作者提供的代码和功能是基于现有知识和技术的开发成果。作者按现有技术水平努力确保代码的正确性和安全性，但不保证代码完全没有错误或缺陷。
本项目依赖的所有第三方库、插件或服务各自遵循其原始开源或商业许可，使用者需自行查阅并遵守相应协议，作者不对第三方组件的稳定性、安全性及合规性承担任何责任。
使用者在使用本项目时必须严格遵守 GNU General Public License v3.0 的要求，并在适当的地方注明使用了 GNU General Public License v3.0 的代码。
使用者在使用本项目的代码和功能时，必须自行研究相关法律法规，并确保其使用行为合法合规。任何因违反法律法规而导致的法律责任和风险，均由使用者自行承担。
使用者不得使用本工具从事任何侵犯知识产权的行为，包括但不限于未经授权下载、传播受版权保护的内容，开发者不参与、不支持、不认可任何非法内容的获取或分发。
本项目不对使用者涉及的数据收集、存储、传输等处理活动的合规性承担责任。使用者应自行遵守相关法律法规，确保处理行为合法正当；因违规操作导致的法律责任由使用者自行承担。
使用者在任何情况下均不得将本项目的作者、贡献者或其他相关方与使用者的使用行为联系起来，或要求其对使用者使用本项目所产生的任何损失或损害负责。
本项目的作者不会提供 XHS-Downloader 项目的付费版本，也不会提供与 XHS-Downloader 项目相关的任何商业服务。
基于本项目进行的任何二次开发、修改或编译的程序与原创作者无关，原创作者不承担与二次开发行为或其结果相关的任何责任，使用者应自行对因二次开发可能带来的各种情况负全部责任。
本项目不授予使用者任何专利许可；若使用本项目导致专利纠纷或侵权，使用者自行承担全部风险和责任。未经作者或权利人书面授权，不得使用本项目进行任何商业宣传、推广或再授权。
作者保留随时终止向任何违反本声明的使用者提供服务的权利，并可能要求其销毁已获取的代码及衍生作品。
作者保留在不另行通知的情况下更新本声明的权利，使用者持续使用即视为接受修订后的条款。

在使用本项目的代码和功能之前，请您认真考虑并接受以上免责声明。如果您对上述声明有任何疑问或不同意，请不要使用本项目的代码和功能。如果您使用了本项目的代码和功能，则视为您已完全理解并接受上述免责声明，并自愿承担使用本项目的一切风险和后果。