你好,这里是 LazySheep
我是 Hengtao Wu,目前在做一些和语音、生成模型相关的事情,方向主要包括:
- Text-to-Speech (TTS)
- Agent / 多模态生成
- 一点点工程实践 + 一点点好奇心驱动的探索
这个博客在写什么?
这个博客主要分成两种内容:
- 随笔:一些零碎的想法、记录、以及偶尔的“自言自语”
- 笔记:相对结构化的学习内容,比如论文理解、技术总结
写它的目的其实很简单:
👉 把“学过的东西留下来”,顺便看看自己能走多远
我的个人主页
如果你想看更完整的信息(比如项目、经历之类的),可以去这里:
那里更像是一个“正式一点”的主页,
而这里更随意一些。
在做的事情
最近主要在折腾:
- TTS 相关模型(包括一些生成式方法)
- 尝试把 LLM / Agent 和语音结合起来
- 做一些小 demo(有的成功了,有的还在挣扎)
联系方式
- GitHub: https://github.com/lazysheep006
- Email: eternity_w@sjtu.edu.cn
如果你刚好也在做类似的事情,或者只是路过看到这里,
都欢迎随便看看