极速进化,光速转录,C++版本人工智能实时语音转文字(字幕/语音识别)Whisper.cpp实践

业界良心OpenAI开源的Whisper模型是开源语音转文字领域的执牛耳者,白璧微瑕之处在于无法通过苹果M芯片优化转录效率,Whisper.cpp 则是 Whisper 模型的 C/C++ 移植版本,它具有无依赖项、内存使用量低等特点,重要的是增加了 Core ML 支持,完美适配苹果M系列芯片。

民谣女神唱流行,基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

流行天后孙燕姿的音色固然是极好的,但是目前全网都是她的声音复刻,听多了难免会有些审美疲劳,在网络上检索了一圈,还没有发现民谣歌手的音色模型,人就是这样,得不到的永远在骚动,本次我们自己构建训练集,来打造自己的音色模型,让民谣女神来唱流行歌曲,要多带劲就有多带劲。 构建训练集 训练集是指用于训练神经网

跨主机Docker容器通信的学习

背景 骨折在家找自己的人比较少. 又因为出不去也没法做运动,就不如将之前没学习深入的地方学习下 先是进行Docker 搭建 redis cluster的处理. 当时发现必须使用 --net=host进行. 本来想尝试进行 overlay的网咯进行搭建 当然有一个目的是验证 overlay的性能损耗

[转帖]国产服务器CPU架构与行业研究报告(节选五)

https://zhuanlan.zhihu.com/p/548456392 6 人赞同了该文章 ​ 目录 收起 5 服务器CPU市场 5.1 服务器CPU产业链 5.2 服务器CPU市场规模 5.3 竞争格局 5.3.1 多种架构竞争格局 5.3.2 同质化竞争态势凸显,自主可控仍需努力 5.3.

[转帖]bpftool perf kprobe uprobe

https://zhuanlan.zhihu.com/p/543218645 1 人赞同了该文章 1、perf子命令用来显示哪些BPF程序正在通过perf_event_open进行挂载。# bpftool perf (bpf只支持这么一个简单的显示功能,具体bpf程序怎么去通过perf_event_

[转帖]word 字号 与 px pt 对应关系

零一 ​关注他 3 人赞同了该文章 字号word pointpixel (96dpi)毫米 初号 42pt 56px 14.82mm 小初 36pt 48px 12.70mm 一号 26pt 34.7px 9.17mm 小一 24pt 32px 8.47mm 二号 22pt 29.3px 7.76m

[转帖]手机快充大一统,中国人先走一步

https://zhidx.com/p/349745.html 苹果公司躺吃Lighting接口红利十年后,突然一个“Deadline”砸到了自己头上。 年前,欧盟已经正式通过新规,以后手机想在欧盟范围内卖,就必须要用Type-C充电接口,这项规定的执行时间是2024年12月28日。 新规通过后,苹

[转帖]Linux内存管理——大部分人没有掌握的shmall和shmmax参数

https://zhuanlan.zhihu.com/p/551804053 内核中的 shmall 和 shmmax 参数 SHMMAX= 配置了最大的内存segment的大小 >这个设置的比SGA_MAX_SIZE大比较好。 SHMMIN= 最小的内存segment的大小 SHMMNI= 整个系

[转帖]新版 Elasticsearch 中的强悍插件 X-pack

https://zhuanlan.zhihu.com/p/36337697 3 人赞同了该文章 作者:Alan 岂安科技运维工程师努力踏上一条为后人留坑的运维之路。(逃 1 前言 Elk 日志可视化管理系是目前比较主流的一套日志管理工具。对日志查找,阅读、收集都非常方便。所以今天的正文来了,今天文章

安全配置错误规避指南

在2019 年,安全研究人员发现 Atlassian JIRA 中存在安全配置错误,这是一款全球超过 100,000 家组织和政府机构使用的项目管理软件。JIRA 配置错误允许任何人通过简单的搜索查询访问敏感信息,包括企业员工姓名、电子邮件地址和有关内部机密项目的机密详细信息。安全配置错误已成为十分

文章学习 | 大模型发展

嬗变:大语言模型带来的人工智能新纪元 | CCCF精选 盖茨说:大语言模型创新的影响力可以与20世纪60年代的微处理器、80年代的个人电脑、90年代的互联网和21世纪初的苹果手机媲美。 大模型的创新 大语言模型是人工智能领域自然语言处理的一部分。在大语言模型出现之前,自然语言处理主要依赖循环神经网络

大语言模型的开发利器langchain

[toc] # 简介 最近随着chatgpt的兴起,人工智能和大语言模型又再次进入了人们的视野,不同的是这一次像是来真的,各大公司都在拼命投入,希望能在未来的AI赛道上占有一席之地。因为AI需要大规模的算力,尤其是对于大语言模型来说。大规模的算力就意味着需要大量金钱的投入。那么对于小公司或者个人来说

2022年终总结

这是工作的第三年了,IT人的三年之痒,亦或许是觉得自己翅膀硬了,我辞去了毕业后第一份国企工作,投奔了某IT大厂 一、变化 这一年,我从泉城济南,来到了成都;离家的距离从1500公里+缩减到了,700公里,以后回家可以考虑飞机以外的交通工具了。 职业上,从纯开发,逐渐向自动化、测试工具开发靠拢,感觉上

驾考宝典携手HMS Core统一扫码服务,构建复杂场景中的流畅扫码体验

“驾考宝典”是一款颇具人气的互联网综合驾照考试学习应用,通过强大的驾考功能,在手机移动端为学车学员提供从报名、学习到拿本的全方位驾考服务。作为一个专业的驾培平台,“驾考宝典”一直以来不断地拓宽学员学车的服务场景,加强学员、驾校、平台之间的联系。而扫码功能作为移动应用上的基础服务,是用户和应用之间快速

AI音乐创作,让每一个人都成为音乐家

从录音带、MP3到专业的耳机、音箱,随着音乐消费方式的不断升级,音乐创作的专业“门槛”也在AI技术的加持下逐渐大众化,创作者的创新设计、创作频率也在持续增强,能降低创作门槛且智能化的创作工具就显得尤为重要。 怀揣着“人人都能玩点音乐”的初衷,唱鸭搭建了自己的音乐社区,希望为普通用户提供智能有趣的音乐

为啥不适合,依然有很多人大张旗鼓搞企业内部开源?(下)

公司里做事无非「利益」二字。公司利益,团队利益和个人利益。如果三者能高度统一,那当然是好的。很多时候未必能完全统一,尤其是中间团队的利益,这个时候特别需要中间团队负责人的大局观。有的团队人浮于事,先把团队「吹起来」,然后再把事情「铺开来」,再把效果「美颜起来」,至于真实作用闭口不谈。根本没有一个长远

基于K-means聚类算法进行客户人群分析

摘要:在本案例中,我们使用人工智能技术的聚类算法去分析超市购物中心客户的一些基本数据,把客户分成不同的群体,供营销团队参考并相应地制定营销策略。 本文分享自华为云社区《基于K-means聚类算法进行客户人群分析》,作者:HWCloudAI 。 实验目标 掌握如何通过机器学习算法进行用户群体分析; 掌

PPT 求职应聘:如何制作人物介绍

PPT 求职应聘:如何制作人物介绍 单人展示

京东金融APP-新交互技术“虚拟数字人”赋能世界杯主题营销

作者:平台研发部,智能服务与产品部 距离加文·伍德提出web3.0已经过去8年时间,这8年加文·伍德创建的以太坊大放异彩,同时由web3.0引出的数字人、元宇宙也生根发芽,茁壮成长,带来了非凡的用户体验。 在互联网产业都在寻求打造元宇宙新生态系统的背景下,数字人担任着信息制造、传递的责任,是连接虚实

浅谈服务接口的高可用设计

作为一个后端研发人员,开发服务接口是我正常不过的工作了,这些接口不管是面向前端HTTP或者是供其他服务RPC远程调用的,都绕不开一个共同的话题就是“高可用”,接口开发往往看似简单,但保证高可用这块实现起来却不并没有想想的那么容易,接下来我们就看一下,一个高可用的接口是该考虑哪些内容,同时文中有不足的欢迎批评指正。