Skip to content

Releases: Ikaros-521/AI-Vtuber

v0.20.0 20130924

25 Sep 06:48
ada599a
Compare
Choose a tag to compare
  • 2023-09-23

    • 新增积分页的GUI实现,并且优化了UI部分动态加载数据的源码
    • 新增 通义千问 的接入
    • GUI的下拉选择框支持编辑,可以填入关键词进行直接的搜索
  • 2023-09-22

    • 新增积分页,积分页暂时只完成了签到板块的显示功能
    • 完成积分机制目前所有后端功能
  • 2023-09-21

    • 弹幕处理新增全标点符号的弹幕过滤
    • 追加几个本地问答,让ai有所b数;更新投资人信息
    • 更新违禁词库
  • 2023-09-20

    • 智谱回复部分如果存在多\情况,则会删除重复的\仅保留一个
  • 2023-09-19

    • 新增游戏demo例程
    • 修改默认配置关闭积分机制
  • 2023-09-18

    • 积分机制 新增礼物和入场积分记录的实现,GUI未适配;默认配置修改。
    • 积分机制 新增查询功能,用户可以查询积分情况,GUI未适配;
  • 2023-09-17

    • 后移web字幕打印机调用的位置,让其可以对其音频合成部分
  • 2023-09-16

    • 录音页 新增录音按键` 数字1左边按键
  • 2023-09-16

    • 新增积分表,暂时只做了b站的签到部分功能,GUI未适配
  • 2023-09-14

    • 更新requirements_common.txt,解决aiohttp等版本冲突问题 —— vantang
  • 2023-09-13

    • GUI缩短配置项长度,给右侧预留10%的空间,方便鼠标在此处停留使用滚轮功能。
    • 更新切分算法,没有最长字符的强制切分,读句子会丝滑,但是千万要断句啊,怕你电脑吃不消
  • 2023-09-12

    • vits-fast新增配置项 语言,可以固定合成语言或自动识别
    • 新增文心一言web版API接入
  • 2023-09-11

    • 删除聊天页ctrl+c或z的程序退出功能
  • 2023-09-10

    • 新增 念弹幕功能,可以对直播间弹幕进行复读,更有针对性,试用助理场景(另外发现b站的用户名被加密了)
    • 修复GUI内置文档超链接过期问题
  • 2023-09-09

    • 文档独立到单独仓库,在线访问。
    • 聊天页 文本输入框支持回车按键触发发送。
  • 2023-09-08

    • VITS下,兼容bert-vits2
  • 2023-09-05

    • 修复后置回复没法关闭 念用户名 的bug
    • 删除部分无关紧要的违禁词
    • 本地问答文本库 新增动态变量{username},用于替换用户名
  • 2023-09-03
    - b站板块可以选择不登录(部分用户不登录也可以正常使用)

v0.19.0 20230903

03 Sep 08:20
fec08f9
Compare
Choose a tag to compare
  • 2023-08-27

    • 新增web字幕打印机的接入
  • 2023-08-29

    • TTS新增VALL-E-X的接入
  • 2023-09-01

    • 新增 智谱AI的接入,支持上下文记忆。
    • 修复智谱AI返回内容有\n时,也会进行语音合成的bug
    • 删除部分违禁词
    • 念用户名时,删除用户名中存在的特殊符号
    • 顶部菜单栏新增Q群跳转,改名 帮助
  • 2023-09-02

    • 补充、删减部分违禁词
    • 补充遗漏的zhipuai库
    • 入场和礼物感谢部分删除用户名中存在的特殊符号
    • 抖音关注事件可以触发关注感谢话术
    • 基本实现动态文案功能,待后续使用体验中完善
    • 更新b站监听库到16.0.0版本,新增b站登录板块,获取cookie等信息解决弹幕监听丢失问题(强烈建议使用小号登录,有风险)
    • 修复GUI b站部分配置项描述错误
  • 2023-09-03

    • 新增 谷歌bard的接入,支持上下文记忆。

v0.18.0 主要修复了一些bug,见日志

25 Aug 16:53
bf75dba
Compare
Choose a tag to compare
  • 2023-08-16

    • 增加基于docsify的文档
    • 美化logo
    • 简单的初步美化下GUI
  • 2023-08-18

    • 后置部分GPT_MODEL配置,规避一次性全加载问题
    • 修复 LLM部分GUI板块显隐bug
    • 讯飞星火库需要升级才能恢复兼容(已更新依赖)
    • 修复部分GUI显示bug
    • 恢复Claude2的兼容
  • 2023-08-19

    • 新增 音频播放板块,暂时只提供音频播放的开关。
    • GUI优化按钮无边框问题;关于新增 在线文档 跳转入口
  • 2023-08-20

    • 新增 动态文案 版本GUI部分的实现(功能还未实现)
  • 2023-08-23

    • 近期发现有第三方直接套娃售卖项目,可怜的娃呀,收手吧。另外,套娃的,不分钱给我,我觉得这不合适吧(
  • 2023-08-24

    • audio合成 音频合成部分新增合成内容的日志,方便后期合成音频时的bug定位

v0.17.0 20230815 详情看描述

15 Aug 16:35
8c19c91
Compare
Choose a tag to compare

2023-08-07

  • VITS全面改为VITS-Fast,新增VITS(原版,配合vits-simple-api使用),此更新变动较大,可能存在隐患,需要注意
  • 优化audio部分代码,tts部分源码全部拆到utils\audio_handle\my_tts.py
  • 修复VITS配置保存后错乱的bug

2023-08-08

  • 修复违禁拼音在拼音部分包含违禁拼音的情况下也被过滤的bug

2023-08-09

  • 修复本地违禁词库不配置时无法正常工作的bug
  • 修复so-vits-svc+ddsp套娃变声失败的bug
  • 修复音频变声bug
  • 新增langchain_chatglm的接入

2023-08-10

  • vits修改语言配置为下拉框,改默认为自动,修复bug

2023-08-11

  • 过滤板块 新增遗忘保留数的配置项,从默认的1个数改为可以根据自定义配置保留,在定时触发后依次响应。

2023-08-12

  • 新增 斗鱼平台的接入(初步接入,仅有弹幕数据的监听)
  • 修改commit为comment(大改动,单词拼错了,现在才发现,难绷)
  • 新增弹幕、入场、礼物的数据库日志记录(GUI未适配)

2023-08-14

  • 新增Claude2的接入

2023-08-15

  • 弹幕、入场、礼物的数据库日志记录GUI适配

v0.16.0 看日志

05 Aug 16:47
8e55d29
Compare
Choose a tag to compare

2023-07-31

  • 入场&礼物处理追加用户名违禁词过滤
  • 回复用户名支持选择变声开关&自定义前回复、后回复的文案,且支持多文案随机抽取(GUI未匹配)

2023-08-01

  • 本地问答库升级,支持选择2种匹配算法。旧版本 一问一答,新版本 自定义json(更具灵活性)。文本和音频的相似度也分离了。
  • 回复用户名板块 GUI适配,顺便优化了GUI部分对多行文本处理的源码实现

2023-08-02

  • 定时任务GUI支持动态加载
  • b站接入定时任务

2023-08-03

  • 定时任务 报时任务补充分钟的播报
  • 修复定时任务同时存在多个变量时,无法正常运行的bug

2023-08-04

  • 更换快手监听方案,新方案是playwright的形式,建议使用小号,每次用完需要删除cookie下的json文件,因为第二次就异常了,没法正常捕获。暂时只支持弹幕回复。
  • 快手 追加礼物Id和连击数日志,礼物价格和礼物名有待后期维护礼物表;补充默认cookie文件夹
  • 快手 补充定时任务(暂只支持 报时任务)
  • 闻达接入。ChatGPT改为ChatGPT/闻达,配合闻达启动器可以融入openai接口使用。

2023-08-05

  • 聊天页 支持直接合成复读内容,适用于直播中有人值守时直接进行交流。
  • 点歌模式支持新功能-随机点歌,命令在配置文件/GUI中可以自定义
  • GUI新增 自定义板块显隐,用户可以根据自己喜好配置显示的box板块,让配置页面不再臃肿
  • 文案页,文案配置改为动态加载,即可以支持无限制的多套文案。
  • 修复文案和聊天同时使用时,音频播放会一次性播放2个的bug;b站重复调用的部分也做了删除。
  • 文案页 新增文案编号配置项和增删按钮,用于对文案配置进行动态的增删操作。

v0.15.0 看描述吧

29 Jul 03:17
124c788
Compare
Choose a tag to compare

内含ffmpeg,请参考视频 https://www.bilibili.com/video/BV1S14y1Q799,进行环境变量配置

更新内容

2023-07-21

  • 修复edge-tts + so-vits-svc协同下,相对路径无法变声的bug
  • 针对部分用户绝对路径音频加载仍有系统找不到指定文件的情况,恢复相对路径,只在变声条件下转绝对路径
  • 音频变速部分改默认变速变调为默认变速不变调且函数兼容变速变调

2023-07-22

  • 修复音频播放部分,音频变速调用缺失缩进导致变速必定执行的bug

2023-07-23

  • 修复音频播放部分,音频变速语速低于1时变速合成的音频不正常的bug
  • 改变弹幕处理逻辑,先由process_data预处理函数进行指定时间内的数据丢弃后,再进行数据处理,可以有效降低高并发造成的一系列问题
  • dy_old改为接入第三方大佬提供的免费不可商用ws监听
  • 本地问答库支持自定义变量的形式来开发动态语句
  • 本地问答库-文本 修改完全匹配为相似度匹配,暂时和音频匹配共用一个相似度值
  • 文本切分算法,可以通过max_limit_len来对强制切分做自定义,对显卡性能高的用户而言,可以通过增大限制来提高语句流畅度。

2023-07-24

  • 文案模式,文案格式修改,可以无限拓展文案路径数量来达到多类型文案切换的效果,GUI带适配动态加载。

2023-07-25

  • 新增 不启用 聊天类型,修改none为不启用,reread为复读机。关闭聊天(LLM等),既可以应用于直播助理等场景,只负责欢迎和感谢。
  • 接入科大讯飞 星火

2023-07-26

  • 补充遗漏的星火依赖
  • 修复text-Gen max_new_tokens保存失败bug
  • 文案页,音频文件格式支持大写的MP3和WAV
  • 文案页 支持配置连续播放音频条件(超时切换&数量上限)
  • 文案页 文案切换播放逻辑变更,某一文案列表播放放完会重载列表内容,不再等待其他列表均播放完毕后才能重载

2023-07-27

  • ChatGLM支持上下文,默认启动(GUI未适配)
  • 抖音版增加 定时播报任务功能,用户可以自定义是否启用,循环时间和定时任务文案(变量可自行修改源码追加功能)

2023-07-29

  • 修复elevenlabs配置同新版不匹配导致无法使用的bug
  • 新增bark-gui的接入
  • 修复ChatGLM上下文记忆bug,并新增GUI相关配置,可以启用和设置最大记忆字符长度
  • 数据丢弃机制补全GUI配置

2023-07-30

  • 修复点歌搜索失败bug
  • 修改默认的切分算法的最大长度为40字

v0.14.0 看描述吧

20 Jul 15:54
578f1b2
Compare
Choose a tag to compare

本版本bug:ffmpeg缺失,请参考视频 https://www.bilibili.com/video/BV1S14y1Q799,进行环境变量配置

2023-07-19

  • 优化audio中vits接口的设计&优化代码减少冗余
  • 新增本地问答音频库,机制类似点歌,通过编辑音频文件名做为触发匹配关键词,优先级第二高,匹配命中后直接会进行匹配音频的播放。
  • 新增自定义上下限音频随机变速,对普通音频播放和文案音频播放可以进行随机变速配置。(GUI未适配)

2023-07-20

  • 增加ffmpeg缺失的解决方案
  • 文案模式增加了一组文案配置,也就是说有2块文案,会进行左右切换的播放,都播放完毕后会进行新的一轮播放。
  • 新增LLM后的第二重过滤(违禁词、链接、拼音)
  • 违禁拼音配置内容需要是中文,需要注意,已更正
  • 新增 念用户名的功能,例:回复xxx。你好
  • 新增用户名过滤(违禁词、链接、拼音)
  • 修复本地问答音频匹配,传入音频后缀导致的匹配错误bug
  • 新增本地问答库匹配 最低相似度配置,用于微调需要的关键词匹配度,已自定义触发灵敏度。
  • 音频随机变速 GUI适配

v0.13.0 新增字幕日志; 抖音版增加入场欢迎和礼物答谢;接入DDSP-SVC

19 Jul 05:07
f1a19e7
Compare
Choose a tag to compare

2023-07-16

  • 新增字幕日志,只会输出即将播放的音频文本,用于直播时的字幕显示。
  • 音频合成的消息队列改成阻塞队列

2023-07-17

  • 抖音版增加入场欢迎和礼物答谢(礼物答谢的金额需要手动维护价格表)
  • 新增 同拼音的违禁拼音过滤机制
  • GUI适配字幕日志的配置

2023-07-18

  • 新增抖音礼物价格数据,礼物价值下限将生效(数据不全,可以自行补充)
  • 优化抖音日志信息,只输出info信息,不在输出debug日志,更加清爽。
  • 接入DDSP-SVC,简单测试了下,效果好像不太对。优化了变声部分的代码

2023-07-19

  • GUI适配DDSP-SVC;补充说明文档

v0.12.0 聊天模式 新增百度,可连续对话;openai_gpt支持提示词模板;优化

16 Jul 09:19
7482383
Compare
Choose a tag to compare

更新日志

2023-07-15

  • 修改 聊天模式-谷歌 为 聊天模式,新增语音识别 百度接口。
  • 追加线程进程退出处理(部分有效)
  • 聊天模式 按键触发兼容英文大小写字母。
  • 聊天模式 支持循环录音功能,新增停止触发按键。

2023-07-16

  • 优化cluade协程处理方式
  • chat_with_file的openai_gpt同样使用提示词模板来自定义回答方式

聊天模式 百度

新用户+实名认证后有半年的免费额度可以使用。
申请地址:https://console.bce.baidu.com/ai/#/ai/speech/overview/index

image
image
image
image
image

v0.11.0 Live2D模型内置多个可更换 & 本地可直接聊天框聊天 & 新TTS 基于GenshinVoice.top

14 Jul 15:01
bb66ae7
Compare
Choose a tag to compare

2023-07-10

  • GUI可以检索Live2D路径下的模型进行动态修改配置。(需要注意,修改后浏览器缓存问题,请用无痕浏览器打开)
  • 追加 Live2D官网所有的免费模型
  • 新增 答谢功能(入场欢迎、礼物答谢),暂时只支持B站,GUI同步进行配置。

2023-07-11

  • 优化文本切分算法

2023-07-12

  • 增加项目的思维导图
  • 增加项目的简易流程图

2023-07-13

  • 聊天页新增聊天框,在运行后可以直接使用聊天框进行聊天
  • 修改audio、sd、claude中所有的time.sleep为异步睡眠

2023-07-14

  • 新增TTS模式 genshinvoice_top,调用第三方接口完成语音合成