type
status
date
slug
summary
tags
category
icon
password
Gemma 3
小参数量,多模态
用 Ollama 运行本地模型
前端项目之前用的是 Chatbox, 可是更新后发现不支持图片了。
于是换用了 mac 专用的一个前端程序 Enchanted,比较简约,功能也比较简易。
现在听说一个 Cherry Studio 项目,之后可以试一试。
Ragflow
LLM 的本地RAG知识库。
需要 docker 部署,占用内存挺大的。
AnythingLLM
相比 Ragflow 更易用一点
本地 RAG 的效果我试下来并没有很好。
NotebookLM
google 的一个项目,比之前我试过的开源本地方案效果好太多。
这个项目我觉得非常好,是个宝藏项目,而且还免费。
Crawl4ai
配合这个包可以获得网页的markdown格式的文件
再用python处理多余信息
我用其爬了 Mistborn Fandom wiki 的 213 个文章
Wikipedia-api
可以用这个来爬取 wikipedia 的文章
Kokoro
TTS 项目,模型很轻量级。
运用预训练的模型音色,英文效果不错。
中文项目中说是支持的,但是我本地运行时会出错。
Excalidraw
手绘风格的画图软件,作为工具还是不错的。
Qwen Omni
Mercury coder
IndexTTS
bilibili 团队做的 clone TTS 项目,比较轻量级,比较类似的项目是字节做的 MegaTTS3, 我在Google colab 上跑了一下,20s 的 sample,就能模仿 southern accent,比之前试过的 xtts 感觉要好很多。
ebook2audio
实现了从电子书到有声书的自动化流程,但是用的 TTS 项目不是最新的,但是框架可以利用。我在 colab 上挂了 2个多小时,转换了一本书,效果还是可以的。
白嫖算力
Google colab
腾讯 cloud studio
自己改了一个将epub提取为句子存储到json的程序,然后再用index-tts批量合成。我用的是腾讯云的 cloud studio,30g内存,16g显存 Tesla T4. 每个月有一万分钟免费时长。
多模态 LLM
Qwen 2.5 VL, Gemma 3, Kimi VL
- Author:FlowerMouse
- URL:https://tangly1024.com/article/playground
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!