与#数据量#相关的内容第4页 - PmDaddy

全部分类数据库前端云计算

Vitess全局唯一ID生成的实现方案

为了标识一段数据，通常我们会为其指定一个唯一id，比如利用MySQL数据库中的自增主键。但是当数据量非常大时，仅靠数据库的自增主键是远远不够的，并且对于分布式数据库只依赖MySQL的自增id无法满足全局唯一的需求。因此，产生了多种解决方案，如UUID，SnowFlake等。下文将介绍Vitess是如何解决这个问题的。

Trino容错模式深度测评与思考

Trino是一款开源的高性能、分布式SQL查询引擎，专门用于对各种异构数据源运行交互式分析查询，支持从GB到PB的数据量范围。

【最佳实践】高可用mongodb集群(1分片+3副本):规划及部署

结合我们的生产需求，本次详细整理了最新版本 MonogoDB 7.0 集群的规划及部署过程，具有较大的参考价值，基本可照搬使用。适应数据规模为T级的场景，由于设计了分片支撑，后续如有大数据量需求，可分片横向扩展。 ■■■ 分片集群规划 ■ Configure hostname、hosts file

糟糕，数据库异常不可用怎么办？

摘要：糟糕，数据库异常不可用怎么办？挺着急的，在线等。本文分享自华为云社区《糟糕，数据库异常不可用怎么办？》，作者：GaussDB 数据库。随着数字化转型的加速，数据量爆发式增长，用户对数据库运维能力要求更高，实现对数据库的高效智能管理，尤其是业务异常时，数据库运维平台能自动定位故障并修复，或者

分布式缓存服务DCS：企业版性能更强，稳定性更高

摘要：企业版性能指标达到业界TOP1，行业领先30%，内核态实现真正多线程。一．背景介绍近年来，随着各行业业务需求急速增加，数据量和并发访问量呈指数级增长，原来只能依附于关系型数据库的传统“缓存”逐渐难以支撑上层业务，开源Redis也面临着如“容量有限”、 “可靠性有限”、 “数据重复拷贝，成本

实例讲解Spring boot动态切换数据源

摘要：本文模拟一下在主库查询订单信息查询不到的时候，切换数据源去历史库里面查询。本文分享自华为云社区《springboot动态切换数据源》，作者：小陈没烦恼。前言在公司的系统里，由于数据量较大，所以配置了多个数据源，它会根据用户所在的地区去查询那一个数据库，这样就产生了动态切换数据源的场景。

【Azure 存储服务】存储在Azure Storage Table中的数据，如何按照条件进行删除呢？

问题描述如何按条件删除 Storage Table 中的数据，如果Table中有大量的条记录需要删除，Java代码如何按条件删除 Table中的数据(Entity)? （通过Azure Storage Explorer工具是可以删除，但是由于数据量太大，人工操作耗时太久，所以需要使用Java代码完

使用spark-sql处理Doris大表关联

背景最近项目上有一个需求，需要将两张表(A表和B表)的数据进行关联并回写入其中一张表(A表)，两张表都是分区表，但是关联条件不包括分区字段。分析过程方案一最朴素的想法，直接关联执行，全表关联，一条SQL搞定全部逻辑。想法越简单，执行越困难。由于数据量大，服务器规模较小，尽管各台服务器内存和C

贝壳找房: 为 AI 平台打造混合多云的存储加速底座

贝壳机器学习平台的计算资源，尤其是 GPU，主要依赖公有云服务，并分布在不同的地理区域。为了让存储可以灵活地跟随计算资源，存储系统需具备高度的灵活性，支持跨区域的数据访问和迁移，同时确保计算任务的连续性和高效性；此外，随着数据量的增长，元数据管理的压力也在逐渐加大。贝壳机器学习平台团队从去年开始对

.NET集成DeveloperSharp实现"高效分页"&"无主键分页"

DeveloperSharp系列近期又被制造业ERP、民航飞行App、建筑BIM、电力掌上营业厅、等多家大型采用，站在巨人的肩膀上你能走的更远。支持.Net Core2.0及以上，支持.Net Framework4.0及以上数据分页，几乎是任何应用系统的必备功能。但当数据量较大时，分页操作的效率

在 Flask 项目中配置 Session：简明指南

本文介绍如何在 Flask 项目中配置会话 1. Flask 内置会话 Flask 自带会话管理功能，使用客户端 Cookie 存储会话数据。默认情况下，会话数据是签名的，以防止篡改，但未加密。因此，不建议在会话中存储敏感信息。Flask 内置会话适用于小型应用或会话数据量较少的情况。此外，默认情况

刷爆 LeetCode 周赛 337，位掩码/回溯/同余/分桶/动态规划·打家劫舍/贪心

本文已收录到 AndroidFamily，技术和职场问题，请关注公众号 [彭旭锐] 提问。大家好，我是小彭。上周末是 LeetCode 第 337 场周赛，你参加了吗？这场周赛第三题有点放水，如果按照题目的数据量来说最多算 Easy 题，但如果按照动态规划来做可以算 Hard 题。小彭的技术交

以小博大外小内大,Db数据库SQL优化之小数据驱动大数据

SQL优化中，有一条放之四海而皆准的既定方针，那就是：永远以小数据驱动大数据。其本质其实就是以小的数据样本作为驱动查询能够优化查询效率，在SQL中，涉及到不同表数据的连接、转移、或者合并，这些操作必须得有个数据集作为“带头”大哥，即驱动数据，而这个驱动数据最好是数据量最小的那一个。内大外小在讨论

【转帖】MySQL 8.0 hash join有重大缺陷？

我并不这么看。友情提醒：本文建议在PC端阅读。徐春阳老师发文爆MySQL 8.0 hash join有重大缺陷。文章核心观点如下：多表（比如3个个表）join时，只会简单的把表数据量小的放在前面作为驱动表，大表放在最后面，从而导致可能产生极大结果集的笛卡尔积，甚至耗尽CPU和磁盘空间。就此现

[转帖]Prometheus监控系统存储容量优化攻略，让你的数据安心保存！

云原生监控领域不可撼动，Prometheus 是不是就没缺点？显然不是。一个软件如果什么问题都想解决，就会导致什么问题都解决不好。所以Prometheus 也存在不足，广受诟病的问题就是单机存储不好扩展。 1 真的需要扩展容量吗？大部分场景其实不需要扩展，因为一般的数据量压根达不到 Prome

基于ClickHouse解决活动海量数据问题

魔笛活动平台要记录每个活动的用户行为数据，帮助客服、运营、产品、研发等快速处理客诉、解决线上问题并进行相关数据分析和报警。可以预见到需要存储和分析海量数据，预估至少几十亿甚至上百亿的数据量，所以需要选择一款能存储海量数据的数据库。由于是通过接收MQ存储或者API方式存储，所以对实时写入性能也有一定要求

es mysql 适用场景对比

# es mysql 适用场景对比 ## 问题一 ### 全文检索毫无疑问直接上es，那么除了这种场景，什么时候该选es？为啥mysql不行？ #### 对枚举字段的搜索 mysql创建索引的原则是对于那些区别度高字段建立索引，区别度越高的索引，在数据量大的情况下，索引效果越好。因为mysql建立

深入MySQL索引，这篇千万不能错过

大家好，我是【码老思】，索引是一个数据库绕不开的话题，今天和大家一起聊聊。 1. 索引索引是对数据库表中一列或多列的值进行排序的一种结构。 MySQL索引的建立对于MySQL的高效运行是很重要的，索引可以大大提高MySQL的检索速度。索引只是提高效率的一个因素，如果你的MySQL有大数据量的表，就

【pandas小技巧】--缺失值的列

在实际应用中，数据集中经常会存在缺失值，也就是某些数据项的值并未填充或者填充不完整。缺失值的存在可能会对后续的数据分析和建模产生影响，因此需要进行处理。 `pandas`提供了多种方法来处理缺失值，例如删除缺失值、填充缺失值等。删除缺失值可能会导致数据量减少，填充缺失值则能够尽量保留原始数据集的完整

教你如何解决T+0的问题

摘要：T+0查询是指实时数据查询，数据查询统计时将涉及到最新产生的数据。本文分享自华为云社区《大数据解决方案：解决T+0问题》，作者：小虚竹。 T+0问题 T+0查询是指实时数据查询，数据查询统计时将涉及到最新产生的数据。在数据量不大时，T+0很容易完成，直接基于生产数据库查询就可以了。但是，

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化