[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-72339":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":13,"openIssues":13,"contributorsCount":14,"subscribersCount":14,"size":14,"stars1d":15,"stars7d":16,"stars30d":16,"stars90d":14,"forks30d":14,"starsTrendScore":17,"compositeScore":18,"rankGlobal":9,"rankLanguage":9,"license":19,"archived":20,"fork":20,"defaultBranch":21,"hasWiki":20,"hasPages":20,"topics":22,"createdAt":9,"pushedAt":9,"updatedAt":23,"readmeContent":24,"aiSummary":25,"trendingCount":14,"starSnapshotCount":14,"syncStatus":15,"lastSyncTime":26,"discoverSource":27},72339,"bilibot","linyiLYi\u002Fbilibot","linyiLYi","A local chatbot fine-tuned by bilibili user comments.",null,"Python",3149,371,22,0,2,3,6,29.71,"Apache License 2.0",false,"main",[],"2026-06-12 02:03:01","# 哔哩哔哩聊天机器人\n\n由[哔哩哔哩](https:\u002F\u002Fbilibili.com)用户评论微调训练而成的本地聊天机器人。支持文字聊天，也可以通过 questions.txt 生成针对给定问题的语音对话。\n\n本项目文字生成使用的基础模型为 [Qwen1.5-32B-Chat](https:\u002F\u002Fhuggingface.co\u002FQwen\u002FQwen1.5-32B-Chat)，借助苹果 [mlx-lm LORA 示例项目](https:\u002F\u002Fgithub.com\u002Fml-explore\u002Fmlx-examples\u002Fblob\u002Fmain\u002Fllms\u002Fmlx_lm\u002FLORA.md) 对基础模型进行微调训练。语音生成部分基于开源项目 [GPT-SoVITS](https:\u002F\u002Fgithub.com\u002FRVC-Boss\u002FGPT-SoVITS)，问题语音来自 B 站用户[白菜工厂1145号员工](https:\u002F\u002Fspace.bilibili.com\u002F518098961)训练的派蒙语音模型。\n\n### 文件结构\n\n项目主要脚本存放在 `main\u002F` 文件夹下，模型存放于 `models\u002F` 文件夹。提示词模板、问题列表存放在 `text\u002F` 文件夹下。`tools\u002Fcompress_model.py` 可以对完整模型进行量化压缩，大大加快模型内容生成速度。\n\n## 运行指南\n\n本项目基于 Python 编程语言，程序运行使用的 Python 版本为 3.10，建议使用 [Anaconda](https:\u002F\u002Fwww.anaconda.com) 配置 Python 环境。以下配置过程已在 macOS 系统测试通过。\n\n\n### 配置环境\n\n```\nconda create -n bilibot python=3.10\nconda activate bilibot\ncd bilibot\npip install -r requirements.txt\n```\n\n### 模型微调训练与推理测试\n\n使用控制台指令，借助 [mlx-lm](https:\u002F\u002Fgithub.com\u002Fml-explore\u002Fmlx-examples\u002Fblob\u002Fmain\u002Fllms\u002Fmlx_lm\u002FLORA.md) 对 Qwen1.5-32B-Chat 进行微调：\n\n```\npython -m mlx_lm.lora --model models\u002FQwen1.5-32B-Chat --data data\u002F --train --iters 1000 --batch-size 16 --lora-layers 12\n```\n\n将微调后的 `adapters` 文件与基础模型合并：\n\n```\npython -m mlx_lm.fuse --model models\u002FQwen1.5-32B-Chat --save-path models\u002FQwen1.5-32B-Chat-FT --adapter-path models\u002FQwen1.5-32B-Chat-Adapters\n```\n\n对合并后的模型进行量化加速：\npython tools\u002Fcompress_model.py\n\n对微调训练后的模型进行对话测试：\npython chat.py\n\n### 语音生成\n本项目借助开源项目 [GPT-SoVITS](https:\u002F\u002Fgithub.com\u002FRVC-Boss\u002FGPT-SoVITS) 进行语音生成。\n\n首先参考 [GPT-SoVITS](https:\u002F\u002Fgithub.com\u002FRVC-Boss\u002FGPT-SoVITS) 的官方指南配置环境并运行语音生成程序。\n\n```\nconda create -n GPTSOVITS python=3.9\nconda activate GPTSOVITS\ncd GPT-SoVITS\npip install -r requirements.txt\npython webui.py\n```\n\n运行 api 程序，分别使用端口 9880 与 9881 提供派蒙与林亦的语音生成服务，以下请使用 GPT-SoVITS 代码库完成：\n```\npython api.py -s SoVITS_weights\u002Fpaimeng2_e110_s159940.pth -g GPT_weights\u002Fpaimeng2-e10.ckpt -dr samples\u002FPaimon\u002F疑问—哇，这个，还有这个…只是和史莱姆打了一场，就有这么多结论吗？.wav -dt \"哇，这个，还有这个…只是和史莱姆打了一场，就有这么多结论吗？\" -dl \"zh\" -a 127.0.0.1 -p 9880\npython api.py -s SoVITS_weights\u002Flinyi_e25_s1150.pth -g GPT_weights\u002Flinyi-e50.ckpt -dr \"samples\u002Flinyi\u002F【愤怒】你这问题太弱智了，我都不知道该从哪开始骂你。.WAV\" -dt \"你这问题太弱智了，我都不知道该从哪开始骂你。\" -dl \"zh\" -a 127.0.0.1 -p 9881\n```\n\n运行问答生成程序：\n```\npython start_qa_dialogue.py\n```\n\n## 参考\n\n1. 机器学习框架 MLX，来自苹果机器学习研究组：https:\u002F\u002Fgithub.com\u002Fml-explore\u002Fmlx\n2. 阿里通义千问 Qwen1.5：https:\u002F\u002Fqwenlm.github.io\u002Fzh\u002Fblog\u002Fqwen1.5\u002F\n3. 开源文本转语音项目 GPT-SoVITS，作者[花儿不哭](https:\u002F\u002Fspace.bilibili.com\u002F5760446)：https:\u002F\u002Fgithub.com\u002FRVC-Boss\u002FGPT-SoVITS\n4. 派蒙语音模型，作者[白菜工厂1145号员工](https:\u002F\u002Fspace.bilibili.com\u002F518098961)：[【GPT-SoVITS】30小时超大数据集测试，堆时长真的有用吗？](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1Yu4m1N79m)","哔哩哔哩聊天机器人是一个基于哔哩哔哩用户评论微调训练而成的本地聊天系统。它支持文字聊天，并能通过预设的问题列表生成语音对话。项目使用Qwen1.5-32B-Chat作为基础模型，利用苹果mlx-lm LORA示例项目进行微调；语音合成部分则基于GPT-SoVITS开源项目。此外，还提供了一个脚本用于量化压缩模型以提高响应速度。该聊天机器人适用于需要个性化、趣味性强的交互场景，如娱乐应用、在线客服等，特别是对哔哩哔哩文化感兴趣的用户群体。","2026-06-11 03:41:25","high_star"]