与#阿克#相关的内容第6页 - PmDaddy

全部分类数据库前端云计算

聊聊Flink必知必会(二)

### Checkpoint与Barrier Flink是一个有状态的流处理框架，因此需要对状态做持久化，Flink定期保存状态数据到存储空间上，故障发生后从之前的备份中恢复，这个过程被称为Checkpoint机制。而Checkpoint为Flink提供了Exactly-Once的投递保障。流处理

聊聊什么是分布式事务

### 概述分布式事务就是指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上，以上是百度百科的解释。简单的说，就是一次大的操作由不同的小操作组成，这些小的操作分布在不同的服务器上，且属于不同的应用，分布式事务需要保证这些小操作要么全部成功，要么全部失

聊聊Flink的必知必会(三)

### 概述在进行流处理时，很多时候想要对流的有界子集进行聚合分析。例如有如下的需求场景： (1)每分钟的页面浏览(PV)次数。 (2)每用户每周的会话次数。 (3)每分钟每传感器的最高温度。 (4)当电商发布一个秒杀活动时，想要每隔10min了解流量数据。对于这些需求的处理，程序需要处理元素组

聊聊Flink必知必会(四)

### 概述 Flink Streaming API借鉴了谷歌数据流模型(Google Data Flow Model)，它的流API支持不同的时间概念。Flink明确支持以下3个不同的时间概念。 Flink明确支持以下3个不同的时间概念。 (1)事件时间：事件发生的时间，由产生（或存储）事件的设备

聊聊Zookeeper的Session会话超时重连

### 概述简单地说，ZooKeeper的连接与会话就是客户端通过实例化ZooKeeper对象来实现客户端与服务器创建并保持TCP连接的过程。本质上，Session就是一个TCP 长连接。 ### 会话 Session会话的作用： 1. ZK Server 执行任何请求之前，都需要 Client

聊聊Flink CDC必知必会

CDC是(Change Data Capture变更数据获取)的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入INSERT、更新UPDATE、删除DELETE等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。 ## Flink CDC的设

从kafka与Flink的事务原理来看二阶段提交与事务日志的结合使用

两阶段提交的成立要基于以下假设： - 该分布式系统中，存在一个节点作为协调者，其他节点作为参与者，且节点之间可以进行网络通信。 - 所有节点都采用预写式日志，且日志被写入后即被保存在可靠的存储设备上，即使节点损坏也不会导致日志数据的丢失。 - 所有节点不会永久性损坏，即使损坏后也可以恢复。 ###

聊聊Kafka的生产者消费者确认机制

## 生产者确认机制消息从生产者客户端发送至broker服务端topic，需要ack确认。`acks`与`min.insync.replicas`是两个配置参数.其中`acks`是producer的配置参数，`min.insync.replicas`是Broker端的配置参数，这两个参数对于生产者

聊聊Zookeeper技术内幕之客户端与SetData请求处理

从客户端会话创建到网络连接、请求处理，简单的叙述下流程与逻辑 ### 客户端客户端是开发人员使用ZooKeeper最主要的途径，ZooKeeper的客户端主要由以下几个核心组件组成。 - ZooKeeper实例：客户端的入口。 - ClientWatchManager：客户端Watcher管理器。

聊聊我认为的分布式、集群实现关键点

基于常见的中间件(Mysql、ElasticSearch、Zookeeper、Kafka、Redis)等分布式集群设计的机制，自己总结了在在集群设计过程中需要考虑的通用问题。 ### 节点通信机制主节点的增加、删除、通信机制。 ### 路由算法即数据路由到哪个节点的策略机制。在集群内有多个节点，

聊聊日志聚类算法及其应用场景

阅读《[基于 Flink ML 搭建的智能运维算法服务及应用](https://mp.weixin.qq.com/s/yhXiQtUSR4hxp9XWrkiiew "基于 Flink ML 搭建的智能运维算法服务及应用")》一文后，对其中日志聚类算法有了些思考。 ### 概述日志聚类，简而言之是对

聊聊自然语言处理NLP

## 概述自然语言处理(NLP)的正式定义：是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明：它是一组工具，用于从自然语言源(如web页面和文本文档)获取有意义和有用的信息。NLP工具的实现一般是基于机器学习与深度学习、其它算法(Lucene Co

聊聊语言模型与知识图谱

## 语言模型语言模型泛指：大语言模型LLM、通用模型GLM。语言模型也是知识库。基于语言模型下的实现，比如ChatGPT，BERT，ChatGLM等等，这类知识库就像是已经人为处理好、编排好、可直接使用的知识库。 ## 知识图谱知识图谱的定义由Google公司在2012年提出,被界定为用来提

聊聊Transformer和GPT模型

本文基于《生成式人工智能》一书阅读摘要。感兴趣的可以去看看原文。可以说，Transformer已经成为深度学习和深度神经网络技术进步的最亮眼成果之一。Transformer能够催生出像ChatGPT这样的最新人工智能应用成果。 ## 序列到序列(seq2seq) Transformer能实现的核心

聊聊Embedding(嵌入向量)

摘要自《深入浅出Embedding》一问。具体详细内容请移步该书。 ## 概述简单来说，嵌入是用向量表示一个物体，这个物体可以是一个单词、一条语句、一个序列、一件商品、一个动作、一本书、一部电影等，可以说嵌入(Embedding)涉及机器学习、深度学习的绝大部分对象。这些对象是机器学习和深度学习中

聊聊Hugging Face

## 概述 HuggingFace是一个开源社区，提供了开源的AI研发框架、工具集、可在线加载的数据集仓库和预训练模型仓库。HuggingFace提出了一套可以依照的标准研发流程，按照该框架实施工程，能够在一定程度上规避开发混乱、开发人员水平不一致的问题，降低了项目实施的风险及项目和研发人员的耦合度

聊聊HuggingFace Transformer

## 概述参见：[聊聊HuggingFace](https://www.cnblogs.com/zhiyong-ITNote/p/17640835.html) ## 项目组件一个完整的transformer模型主要包含三部分：Config、Tokenizer、Model。 ### Config

聊聊多任务学习

最近翻译的一篇分享中，主要讲解了多任务学习的各个方面，很多的专业术语与概念都不清楚，因此简单的整理了下相关的知识，做个笔记。 ### 概述现在大多数机器学习任务都是单任务学习。对于复杂的问题，也可以分解为简单且相互独立的子问题来单独解决，然后再合并结果，得到最初复杂问题的结果。这样做看似合理，其实

聊聊HuggingFace如何处理大模型下海量数据集

翻译自： [Big data? 🤗 Datasets to the rescue!](https://huggingface.co/learn/nlp-course/chapter5/4?fw=pt#big-data-datasets-to-the-rescue "Big data? 🤗 Dat

聊聊预训练模型的微调

翻译自：[Fine-tuning a model with the Trainer API](https://huggingface.co/learn/nlp-course/chapter3/3?fw=pt "Fine-tuning a model with the Trainer API") `T

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化