与#音频#相关的内容第3页 - PmDaddy

全部分类数据库前端云计算

HiAI Foundation助力端侧音视频AI能力，高性能低功耗释放云侧成本

过去三年是端侧AI高速发展的几年，华为在2020年预言了端侧AI的发展潮流，2021年通过提供端云协同的方式使我们的HiAI Foundation应用性更进一个台阶，2022年提供视频超分端到端的解决方案，在2023HDC大会上，HiAI Foundation基于硬件能力的开放，提供更多场景高效能的

使用rem、动态vh自适应移动端

前言这是我的模仿抖音系列文章的第六篇第一篇：200行代码实现类似Swiper.js的轮播组件第二篇：实现抖音 “视频无限滑动“效果第三篇：Vue 路由使用介绍以及添加转场动画第四篇：Vue 有条件路由缓存，就像传统新闻网站一样第五篇：Github Actions 部署 Pages、同

基于神经网络的柯氏音血压计

具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI技术网页_MCU-AI 前言虽然血压（BP）的测量现在广泛地由自动无创血压（NIBP）监测设备进行，因为它们不需要熟练的临床医生，也不存在并发症的风险，但其准确性仍存疑。本研究开发了一种新的基于端到端深度学习的算法，该算法直接

异构数据源同步之数据同步 → datax 改造，有点意思

开心一刻去年在抖音里谈了个少妇，骗了我 9 万后来我发现了，她怕我报警她把她表妹介绍给我然后她表妹又骗了我 7 万 DataX DataX 是什么，有什么用，怎么用不做介绍，大家自行去官网（DataX）看，Gitee 上也有（DataX）你们别不服，我这是为了逼迫你们去自学，是为了你们好

民谣女神唱流行，基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

流行天后孙燕姿的音色固然是极好的，但是目前全网都是她的声音复刻，听多了难免会有些审美疲劳，在网络上检索了一圈，还没有发现民谣歌手的音色模型，人就是这样，得不到的永远在骚动，本次我们自己构建训练集，来打造自己的音色模型，让民谣女神来唱流行歌曲，要多带劲就有多带劲。构建训练集训练集是指用于训练神经网

DTSE Tech Talk | 第10期：云会议带你入门音视频世界

摘要：本期直播主题是《云会议带你入门音视频世界》，华为云媒体服务产品部资深专家金云飞，与开发者们交流华为云会议在实时音视频行业中的集成应用，帮助开发者更好的理解华为云会议及其开放能力。本期直播主题是《云会议带你入门音视频世界》，华为云媒体服务产品部资深专家金云飞，与开发者们交流华为云会议在实时音视

CosyVoice多语言、音色和情感控制模型，one-shot零样本语音克隆模型本地部署(Win/Mac),通义实验室开源

近日，阿里通义实验室开源了CosyVoice语音模型，它支持自然语音生成，支持多语言、音色和情感控制，在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行能力方面表现卓越。 CosyVoice采用了总共超15万小时的数据训练，支持中英日粤韩5种语言的合成，合成效果显著优于传统语音合成模型。 C

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

AVS3是中国AVS工作组制定的第三代音视频编解码技术标准，也是全球首个已推出的面向8K及5G产业应用的视频编码标准。AVS工作组于2019年3月9日完成第三代AVS视频标准（AVS3）基准档次的制订工作，参考软件的测试表明，AVS3基准档次的性能比上一代标准AVS2和HEVC提升了约30%。 l

FFmpeg开发笔记（二十）Linux环境给FFmpeg集成AVS3解码器

AVS3是中国AVS工作组制定的第三代音视频编解码技术标准，也是全球首个已推出的面向8K及5G产业应用的视频编码标准。AVS工作组于2019年3月9日完成第三代AVS视频标准（AVS3）基准档次的制订工作，参考软件的测试表明，AVS3基准档次的性能比上一代标准AVS2和HEVC提升了约30%。 l

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践，复刻《遥远的歌》，原唱晴子(Python3.10)

忽如一夜春风来，亚洲天后孙燕姿独特而柔美的音色再度响彻华语乐坛，只不过这一次，不是因为她出了新专辑，而是人工智能AI技术对于孙燕姿音色的完美复刻，以大江灌浪之势对华语歌坛诸多经典作品进行了翻唱，还原度令人咋舌，如何做到的? 本次我们借助基于Python3.10的开源库so-vits-svc，让亚洲天

声音好听,颜值能打,基于PaddleGAN给人工智能AI语音模型配上动态画面(Python3.10)

借助So-vits我们可以自己训练五花八门的音色模型，然后复刻想要欣赏的任意歌曲，实现点歌自由，但有时候却又总觉得少了点什么，没错，缺少了画面，只闻其声，却不见其人，本次我们让AI川普的歌声和他伟岸的形象同时出现，基于PaddleGAN构建“靓声靓影”的“懂王”。 PaddlePaddle是百度开源

ChatTTS,语气韵律媲美真人的开源TTS模型,文字转语音界的新魁首,对标微软Azure-tts

前两天 2noise 团队开源了ChatTTS项目，并且释出了相关的音色模型权重，效果确实非常惊艳，让人一听难忘，即使摆在微软的商业级项目Azure-tts面前，也是毫不逊色的。 ChatTTS是专门为对话场景设计的文本转语音模型，例如大语言助手对话任务。它支持英文和中文两种语言。最大的模型使...

OpenVoiceV2本地部署教程,苹果MacOs部署流程,声音响度统一,文字转语音,TTS

最近OpenVoice项目更新了V2版本，新的模型对于中文推理更加友好，音色也得到了一定的提升，本次分享一下如何在苹果的MacOs系统中本地部署OpenVoice的V2版本。首先下载OpenVoiceV2的压缩包： OpenVoiceV2-for-mac代码和模型 https://pan.quar

贝塞尔曲线的切线及其AABB问题

贝塞尔曲线的切线及其AABB问题先聊点别的 2023 年抖音上居然还看到很多前端培训各种直播前端教学（虽然是录播）但看起来还是有大批前往前端卷啊说明了什么，很可能说明其它行业更难卷这不是行业不景气业务下降了么.. 互联网行业是肉眼可见的不景气业务量也下降了，业务相关的工作也变的不再饱和我

FFmpeg开发笔记（三十七）分析SRS对HLS协议里TS包的插帧操作

《FFmpeg开发实战：从零基础到短视频上线》一书的“2.1.2 音视频文件的封装格式”介绍了视频流的PS格式和TS格式。由于TS包的长度固定，从TS流的任一片段开始都能独立解码，因此可以把TS当成音视频文件的封装格式。鉴于TS包的独立解码特性，HLS协议引入了TS格式作为传输单元。HLS协议的

重磅来袭!MoneyPrinterPlus一键发布短视频到视频号,抖音,快手,小红书上线了

MoneyPrinterPlus开源有一段时间了，已经实现了批量短视频混剪，一键生成短视频等功能。有些小伙伴说了，我批量生成的短视频能不能一键上传到视频号,抖音,快手,小红书这些视频平台呢？答案是必须可以。下面上干货。软件准备当然，前提条件就是你需要下载MoneyPrinterPlus软件啦

FFmpeg开发笔记（三十）解析H.264码流中的SPS帧和PPS帧

《FFmpeg开发实战：从零基础到短视频上线》一书的“2.1.1 音视频编码的发展历程”介绍了H.26x系列的视频编码标准，其中H.264至今仍在广泛使用，无论视频文件还是网络直播，H.264标准都占据着可观的市场份额。之所以H.264取得了巨大的成功，是因为它提出了一个新概念，把标准框架划分为

腾讯、阿里、B站最新面经汇总，有的妥妥的凉经。

除了BAT（没错我说的B是B站的B），还有网易、希音科技、美柚等中小厂的最新面经。这次投稿的同学行文幽默风趣，处处透漏着不成功便搞笑的骚气。祝他早日上岸，也欢迎大家在评论区讨论这些面试题，有哪些面试题不知道怎么回答好，可以在评论区讨论留言，我会及时回复的。

FFmpeg开发笔记（十六）Linux交叉编译Android的OpenSSL库

《FFmpeg开发实战：从零基础到短视频上线》一书的例程主要测试本地的音视频文件，当然为了安全起见，很多网络视频都采用了https地址。FFmpeg若要访问https视频，就必须集成第三方的openssl库，但编译FFmpeg时却默认关闭了openssl。为了让App能够播放采用https的在线视

PHP转Go系列 | ThinkPHP与Gin框架之OpenApi授权设计实践

工作中只要接触过第三方开放平台的都离不开 OpenApi，几乎各大平台都会有自己的 OpenApi 比如微信、淘宝、京东、抖音等。在 OpenApi 对接的过程中最首要的环节就是授权，获取到平台的授权 Token 至关重要。

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化