有道文档FM,今天,我就带你一起深度体验这个被严重低估的AI播客神器。
众所周知,我在五一期间效率爆棚,秉持着“停班不停卷”的精神,发布了两篇文章,给大家介绍了谷歌的NotebookLM新推出的中文播客功能,我一度认为,NotebookLM,在中文播客功能上,是打遍天下无敌手的存在。
然而,我那篇文章的余温尚存,另一款产品又走进了我的视线。
事情的起因,是我参加了朋友在杭州举办的《一起AI 交个朋友》活动。
我提早来到现场,在签到后,参与抽奖。
当我看到我抽中的奖品时,我懵了。
有道文档FM 30天会员卡。
有道我知道,文档我知道,FM我也知道,可是这三个词汇组合到一起的时候,让我感觉有点不太明白了。
这啥啊这是,我咋从来没听过这个产品?
不过或许是冥冥中存在着某种羁绊,我在愣了半秒钟之后,我感觉到了一丝不对劲。
字面意思来看,这好像是个FM软件?
向负责发放礼品的小伙伴道了声谢后,我把含有兑换码的礼品卡收到了口袋里,之后就再也没管过它。
活动现场气氛很热烈,老师们的分享也让我受益匪浅,我还抽中了一款智谱的折叠无线充电器。
之后我就把口袋里的礼品卡忘到一边了。
活动结束后,我跟云舒吃了顿饭,然后又散了个步,聊人生聊理想。
回到酒店,由于那张礼品卡和我的房卡手感上太像了,导致我差点犯迷糊,把礼品卡放到房门感应区了。
这个时候我才想起来,口袋里还有张 有道文档FM 的礼品卡。
打开手机应用市场,找到了 有道文档FM 的APP,下载完毕。
当点开软件的那一刻,我才知道,为什么它会叫“有道 文档 FM”。
这个软件的界面非常简洁,简洁到直白地把所有功能都放在了一个页面里,但却能让你顾名思义,一眼就能看懂它是做什么的。
整个页面大概可以分为上下两部分。
一、功能区——它能做什么
这款播客软件,有五个功能,分别为:文本转播客、链接转播客、拍照转播客、文件转播客、录音转写。
1、文本转播客
这个功能,可以把你在文本框里输入的文字转换为播客的内容,比如说你记在笔记软件里的一些灵感,你写的文章内容,甚至是你在网上冲浪时看到的一句有启发的话语,都能够粘贴到这个文本框,让它帮你转为播客。
我抱着“调戏”的心态,在文本框里输入了两个字:“你好”。本以为它会拒绝处理,或者干脆没反应,结果我点击下一步,选择音色和要输出的播客类型之后,它居然就直接开始跑起来了。
而且,生成的居然还是个4分钟的音频,内容还挺丰富。
可以看到,生成后的页面,除了你输入的原文内容之外,还有三个功能,播客字幕,总结,脑图。
值得一提的是,脑图的结构还是很清晰的,哪怕是你完全不知道上下文,通过这幅脑图,你大概也可以知道个八九不离十。
2、链接转播客
输入或粘贴网页链接,AI对内容进行读取,转换为播客,支持的链接有:
公开链接(不设置阅读权限的)、微信公众号、知乎、腾讯文档、飞书文档。
我试着把我昨天发的公众号链接贴了上去,等候几分钟之后,它就帮我生成了一段音频。(就是一开始给你们听的那段)
值得一提的是,生成后的最右下角,有一个导出按钮,你可以选择导出播客文稿和音频到你手机里,或者只选择其中一个,可谓是相当贴心了。
而且——不光只有这个功能有,而是其他功能都有这两个导出选项。
3、拍照转播客
学生党应该会有这样一个痛点:上课的时候,老师不给PPT,讲课节奏又快,导致根本来不及做笔记,怎么办?
那么这个功能就是专门为你预备的!
有道的强大技术力做打底,你完全可以先拍ppt,存到手机里,课后再点开有道文档FM,用这个功能,把你拍的PPT照片都给贴上去,提取文字后生成播客,一次性可以选择9张图片。
如果你的手机像素好,那我建议你直接用系统相机拍完照后,导入相册图片即可。如果你想要方便,也可以用软件自带相机拍摄,它的OCR技术确实已经相当成熟了,哪怕照片有点糊,也能精准帮你识别里面的文字。
我们可以看到,当你拍完照片后,点击“选中全部”(不建议用“自动框选”,因为那个框是不能拖动的,而且很容易识别你不需要它识别的部分),照片里的文字都很清晰地被提取出来,接着再点击“下一步”,生成播客。
这简直就是学生党的福音!从此以后,妈妈再也不用担心你做笔记做到手酸啦!
4、文件转播客
如果你用过这个功能,你就会知道,我为什么会说“再次被打脸”这样的话了,因为它真的——泰裤辣!
它支持市面上常见的文档类型——pdf、doc、txt
这个方面,它和NotebookLM的中文播客基本上是对齐了。比中文播客略胜一筹的是,在不同的使用场景下,它生成的播客时长是不一样的,这个待会儿我会详细说明。
选择文档后,按照你的需求,生成不同讲解深度的播客,选择你要的主播音色,角色可以是一男一女,可以是两名女性,也可以是两名男性,在这一点上,汉语国家的好处就体现出来了——自定义程度高。
我选择的是“深度精讲”模式。它居然给我生成了一段长达半个小时的音频,而且全是干货,没有一点水分,完全能让你上下班通勤的时候,从你下班走出公司,一直听到你到家。说实话,当我第一次看到这个时长,我被惊到了。
5、录音转写
临时被领导拉去开会,什么东西都没准备?
不要慌!这个时候,你只需要两个步骤,就能总结一份会议纪要,轻松获得领导赏识!
第一步:点开 有道文档FM app第二步:点开 录音转写功能
接着,你就可以放下手机,自信满满地跟领导对视,带给他情绪价值,在会议结束后,直接把转写后的笔记整合一下,发给领导,领导看了都夸你:“是个人才!”
虽然没有写支持手机内录,但是这怎么能难道身为小天才的我呢?
如果你想尝试先开启录音,再后台切换软件,那等你满怀期待地再次返回FM的时候,你会很失望——因为它在你切换软件的时候,就自动停止录制了。
我是这样做的:
1、把软件缩小为小窗口
2、点开视频/线上会议软件
3、打开扬声器外放
这个时候你就会发现,视频里的声音,居然能够被转写成文字了!
但是有一个前提,这个方法要求你需要在相对安静,没有干扰的情况下进行,否则你周遭的环境声也会被录进去,导致功亏一篑。
怎么样,是不是超赞?快夸我(一脸骄傲)!
还有一个功能,是不得不提的。
一款文档FM软件,怎么能少的了大模型的加持?
看见功能区的最上方的框框了吗,点进去,输入你想要的问题,你就能够“超出三界外,不在无形中”,把你想要生成的内容直接发给D老师,它不仅能够解答你的问题,在它回复的末尾,更是可以按照回复内容,生成播客,完全不用你看文字,光是用耳朵听,知识就都进到你的脑袋里了。
例如,我让D老师给我讲讲AI的发展史:
它生成的播客内容,不仅完全遵循D老师给我的回复,而且讲的很透彻,真正地把你带到思考当中。
讲完了功能区,再讲讲音频区,也就是存放生成后的音频区域。
二、音频区——它有哪些内容?
音频区有这几个内容板块:
我的(你在功能区生成后的音频)、订阅、英文跟读、考试带背、听见好书。
让我一一来为你讲解,这些板块都是干嘛的。
1、订阅
订阅板块,简单来说,就是根据你的选择,为你展示不同类型的最新资讯,如果你关注国内国外的新闻大事,你可以选择订阅“全球新闻”“国内新闻”板块,它会将前一天的资讯在第二天汇总到你面前,你可以选择适合的音色,为你讲解新闻,就好像随身携带两位专业的新闻主播。
如果你对于经济感兴趣,你可以选择“新消费”和“商业”板块,软件会将热点财经资讯推送给你,让你轻松把握市场脉搏。如果你对健康有着格外的关切,那你可以订阅“健康”和“生命科学”板块,从此在七大姑八大姨等“养生达人”面前,你也有了话语权。如果你是宝爸宝妈,或者是教育行业从业者,“教育”板块绝对你是必不可少的消息来源。如果你也在学习AI,想获取与AI有关的最新动态,订阅“AI趋势”板块, 能帮助你在日新月异的AI领域里,找到立足之处。如果你是一名球迷,或者是运动爱好者,你也能订阅“体育”板块,了解体坛又发生了哪些事件。或者,小孩子才做选择题,你全都要。
2、英文跟读
正在学习英文的你有福了!我们都知道,有道在英语学习方面,有它自己的强劲之处,有道词典,也成为许多朋友学习英语路上的助力。
在这里,有道更是准备了虽然有限,但是内容丰富的英文音频,你能够在一段对话播完后,点击暂停,跟读学习,对于一些还不是很清楚的单词发音,你也能拖动时间条,反复回放,直到你学会为止。
3、考试带背
正在考教资的你,是不是也常常面对着厚厚一叠的材料而感到无从下手?
考试带背,就是正在备考小学教师资格证朋友的必备利器。
同上面的“英语跟读”有些类似的是,它同样是通过手动暂停的方式实现的,你可以在一段内容播完后手动暂停,然后自己再背背看,是否都掌握了,有哪些遗漏的知识点,帮助你进行复盘。
在这个板块,有道准备了小学教资的通用资料,有基础知识、教师能力、文化素养等,可谓是非常友好了。
4、听见好书
想要实现个人增长,却又不知道该看哪些书吗?
有道已经帮你整理好了!
《穷爸爸,富爸爸》、《高效能人士的七个习惯》、《睡眠革命》….这个板块里一共有8本书,都是已经转换为音频的,你可以直接点开听,也可以先看总结或者脑图,边看边听,加深理解。
当你对这些书的内容有所了解后,再去精读整本书,效率就高得多了。
在使用过程中,有道文档FM是有一些功能,让我感到很惊艳的,我来给大家讲一讲。
三、亮点解析
1、支持多种语言
输出语音智支持10种不同国家/地区的语种,不仅是中文,更是涵盖了大部分使用场景。
在中文语音下,支持普通话、港普、台湾腔三种口音。
在英文语音下,支持美音、英音、澳洲口音、印度口音四种,可谓是十分多元化了。
其他语种均为默认口音。
千万别小看这个功能。之所以我觉得它有亮点,就是因为它使用场景广泛。
比如,你正在学习英语,你就可以把一篇新闻材料丢给它,让它用英文来进行讲解,锻炼你的英语听力。或者,你也可以采用跟读的方式,来强化你的口语能力。再比如,你是一名播客创作者,你也能把制作好的内容发布到国外播客平台,用来吸引国外听众,而不再需要你自己会那门语言。再比如…屏幕前的你,一定比我更聪明,能挖掘出更多需求。
欢迎把你的idea发布在评论区,我们一起交流。
2、一百余款主播音色
来回总是那么几种音色,听觉疲劳?
有道文档FM精心准备了100多种音色,无论是成熟风格的矜贵熟男,知性熟女,还是青春向上的青春男大,青涩学妹。。。各种声线,供你挑选。
选择困难症?不存在的!
值得一提的是,作为中国公司的产品,对于中文音色的支持也是最多的,有43种,几乎是占了全部音色数量的一半,其次就是英文音色,有25种音色,很好地满足了不同人群的听感需求。
3、20种讲解模式
对于不同的信息类型,不同的人群有不同的需求。
例如,面对一篇长文本的文档,有的人想要速读,汲取其中精华;
有的人喜欢精读,讲的越细节越好,便于理解;
有的人想要跟听小说一样,听着听着,知识就像水一般,轻柔流入大脑;
有的人则抱有批判性思维,希望在思辨中对信息进行拆解和重构。
以上需求,都能完成。我发现, 有道文档FM 设置了20种讲解模式,不管你是喜欢深度精讲,文档速读,还是睡前故事,辩论赛事,这么多风格,肯定有一款是你喜欢的。
我们需要注意的是:选择不同的讲解模式,生成的音频时长也是不一样的,有些甚至是差别很大。例如,文档速读和深度精讲,内容方面不同,音频时长也大不相同。
4、超拟人的主播对话
在开头那段音频里,大家能听的出来,这款播客真的做到了极高的拟人程度,且是根据不同场景而转换的。
比如,当播客类型是访谈的时候,主播的语音会出现思考停顿,仿佛他真的需要看看稿子,或者要好好思考一样。
当播客类型是脱口秀的时候,就多了一些“即兴感”,例如一个主播正说着话,突然被搭档插话打断,一句话说太长了需要临时缓口气,好像真的在听一档脱口秀。
当播客类型是深度报道的时候,显然是需要比较正式的语气了,这个时候,细节就来了——AI主播也会模仿人类主播报道新闻时的沉重呼吸。
更令人惊奇的是,你听这手机里的虚拟主播对话,居然丝毫没有违和感。在闲聊场景下,他们的声音也是很放松的,而且还会给自己“加戏”———为了不让我们感到奇怪,它甚至会仿造播客节目结构,让体验更真实,在开头的时候提一嘴,说这是他们的第x期,在结束的时候收尾也很自然,会对你说下次再见。
真的,当我听第一段我在这个软件里生成的音频时,我被惊到了:
虚拟和现实的界限,好像开始变得模糊了。
5、开源准备中
我在体验过程中,还了解到一件事——这个项目,有做开源的打算,并且他们团队的技术人员已经在做这件事了,我们可以好好期待一下。
四、一些补充
有些朋友可能就会说了:你夸了这么多,是不是收了有道的钱了?
为了证明我没有恰饭,我也会把我在使用过程中遇到的一些我觉得这款产品有待改进的地方跟大家说说。
首先,你看我使用体验还算不错对吧,又是100多种语音,又是各种音色任你挑选,还能生成30多分钟的音频…
But,打住,让我给你破盆冷水。
这一切,都是因为我兑换了他们的会员。
可以说,如果你充了会员,你使用体验会很好,不会有任何的问题。但是如果你不是会员的情况下,可能会感觉到处处受阻——看下面的表格就知道了。
这是从他们的会员中心截取下来的图片。我们可以看到,普通用户和会员的差别,还是蛮大的。
其次,他支持的文档格式虽然多,但是相比NotebookLM来说,还是有些需要继续优化的地方。
最后,上传文档的大小也有限制,最多只能传20MB左右的文档。
会员的价格倒也不算太贵,这点还是很不错的,哪怕是包年,也就一个充电宝的价格(还是充电宝的事儿)。
或许你会说,这款软件的所有功能,搭个MCP都能实现啊,而且可能还能做的更好。
但是,我要告诉你的是,如果你是一名动手能力不强的小白,光是看那些五花八门的教程,时间都够久了,更别提还要下载软件,动手实践,对于小白来说,MCP的学习成本还是很高的,这是天然的门槛。
而这款软件,完全不需要你任何学习成本,因为它所有的功能都在一个页面里,你一眼就能大概看懂,每个功能是用来干什么的,让你拿到就可以用,这才是它的亮点。
结语
NotebookLM和有道文档FM,目前来说,这两者不是一个量级的东西,但是,请注意!NotebookLM,在2023年底可就已经上线了,而 有道文档FM,是2025年3月25日,也就是一个多月前,才开始公测,向大众开放的。
讲真,一个多月的时间,能够做到这个程度,已经很不错了。
我们应该关注的,或许不是 有道文档FM 到底能不能跟 NotebookLM 过一过招,两者孰优孰劣,而是——
国内大厂已经开始发力,并且要做一款更适合中国人体质的AI原生播客软件。
哪怕 有道文档FM 没想象中的那么好,我们也为它祝福吧,希望它能够迎头赶上,早日做到他们自称的那样——
“中国版NotebookLM”。
我相信这一天不会太远。
行文至此,突然有些恍惚。AI播客对我们到底意味着什么呢?它不仅意味着你能够实现播客自由,更是从底层上,对知识系统的重构,哪怕因为技术的限制,它仍旧还是属于“信息快餐”,但是当各大厂纷纷开始发力的时候,距离传统知识的壁垒被打破,又需要多久呢?
我很好奇。
感谢你看到这里。如果这篇文章对你有所帮助,请点赞、推荐给你的朋友。
你对AI播客和 有道文档FM 有什么看法?欢迎在评论区交流。
本文由 @ Simonlin(公众号同名)原创投稿或授权发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Unsplash,基于CC0协议,该文观点仅代表作者本人。