数据标注工具 doccano | 文本分类(Text Classification)

目录安装运行 doccano打开 doccanno创建项目上传数据定义标签添加成员开始标注导出数据查看数据统计 数据标注工具 Label-Studio 安装 打开命令行(cmd、terminal)执行安装命令 # Python 3.8+ pip install doccano -i https://

白话理解和使用DOCKER VOLUME

出于效率等一系列原因,Docker容器的文件系统在宿主机上存在的方式很复杂,这会带来下面几个问题: 不能在宿主机上很方便地访问容器中的文件。 无法在多个容器之间共享数据。 当容器删除时,容器中产生的数据将会丢失。 为了解决这些问题,Docker引入了数据卷(Volume) 机制。数据卷以独立于Do...

(数据科学学习手札161)高性能数据分析利器DuckDB在Python中的使用

本文完整代码及附件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 大家好我是费老师,就在几天前,经过六年多的持续开发迭代,著名的开源高性能分析型数据库DuckDB发布了其1.0.0正式版本。 DuckDB具有

使用Docker安装Odoo 17(非Docker Compose)

使用Docker安装Odoo 17(非Docker Compose) 前言 最近在学习Odoo,先是windows 安装企业版,多年不用windows的服务器操作系统,一看windows的ECS那么贵就想折腾一下用linux服务器来跑Odoo社区版.于是开始实践,这篇文件只记录结果。其中趟坑的滋味暂

数据分析---numpy模块

前戏 NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、多维数组上执行的数值运算。 快捷键的使用: 添加cell:a或者b 删除:x 修改cell的模式: m:修改成markdown模式

(数据科学学习手札160)使用miniforge代替miniconda

本文已收录至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 大家好我是费老师,conda作为Python数据科学领域的常用软件,是对Python环境及相关依赖进行管理的经典工具,通常集成在anaconda或minic

【数学】主成分分析(PCA)的详细深度推导过程

Based on Deep Learning (2017, MIT) book. 本文基于Deep Learning (2017, MIT),推导过程补全了所涉及的知识及书中推导过程中跳跃和省略的部分。 blog 1 概述 现代数据集,如网络索引、高分辨率图像、气象学、实验测量等,通常包含高维特征,

痞子衡嵌入式:我被邀请做科锐国际旗下数科同道主办的技术沙龙嘉宾

「数科同道」是「科锐国际」旗下的面向技术开发者的专属垂直招聘平台。《数科同道技术沙龙》是由数科同道主办的活动,每期活动邀请行业内及其他知名公司的技术专家分享来自一线的实践经验。自2022年12月起,数科同道将在苏州,聚焦嵌入式行业及人才发展,开展一系列线下分享活动。痞子衡有幸被邀请做12月17日首期

有限覆盖定理与实数理论

《数学分析 I》第四次研讨课第三部分讲稿

[转帖]数据存储四种常见方式

常见的数据存储方式有四种:在线存储、近线存储、脱机存储和站外保护。 不同的存储方式提供不同的获取便利性、安全性和成本开销等级。 在大多数场景中,四种存储方式被混合使用以达到最有效的存储策略。 来看一看这四种数据存储方式各自的含义: 1. 在线存储 (Online storage): 有时也称为二级存

[转帖][译] 数据中心网络:分层网络设计综述(2014)

http://arthurchiao.art/blog/hierarchical-network-design-zh/ 译者序 本文内容翻译自 Cisco 的一门叫 Connecting Networks 的教材(2014), 英文版可以在官网在线阅读 ,也可以在这里下载 PDF(仅前三章)。 搜索

[转帖][译] 数据中心网络:Spine-Leaf 架构设计综述(2016)

http://arthurchiao.art/blog/spine-leaf-design-zh/ 译者序 本文内容翻译自 Cisco 的白皮书 Cisco Data Center Spine-and-Leaf Architecture: Design Overview (2016),翻译非逐字逐句

[转帖]数据中心常见电源线详细介绍

https://www.cnblogs.com/zhangxinglong/p/14246067.html Power Supply Cord 数据中心常见电源线详细介绍 我们都知道在不同的国家或地区会使用许多不同的插头和插座,当然这里也包括分散在世界各地的数据中心。世界上使用的标准不止一种,不同的

[转帖]数据中心NVMe SSD进入PCle5.0阶段

http://blog.itpub.net/31545803/viewspace-2928567/ 当PCle4.0产品正战得酣畅淋漓,属于下一个时代的PCle5.0悄然走来。从去年下半年开始,除了一些国际大厂纷纷推出新品,以宝存科技为代表的国内SSD厂商也在紧跟趋势,部署下一个赛道。 SSD固态硬

[转帖]大数据基础架构Hadoop,终于有人讲明白了

http://blog.itpub.net/70024420/viewspace-2928855/ 导读:大数据正在成为经济社会发展的新的驱动力。随着云计算、移动互联网等网络新技术的应用和发展,社会信息化进程进入大数据时代,海量数据的产生与流转成为常态。而大数据技术也如雨后春笋般正在蓬勃发展中。Ha

[转帖]数据中心机房的概念

https://www.cnblogs.com/gered/p/16953396.html 目录 【1】机房等级分类 (1.1)A级为容错型 (1.2)B级为冗余型 (1.3)C级为基本型 二、数据中心机房组成 【3】数据中心机房标准 (3.1)建筑装修 (3.2)供电系统 (3.3)接地、防雷系统

[转帖]博睿数据披露2022年半年报 实现营收6255.04万元

https://baijiahao.baidu.com/s?id=1742458714721254460&wfr=spider&for=pc 8月26日,A股上市公司博睿数据(代码:688229.SH)发布2022年半年度业绩报告。 2022年1月1日-2022年6月30日,公司实现营业收入6255

【转帖】数据存储四种常见方式

常见的数据存储方式有四种:在线存储、近线存储、脱机存储和站外保护。 不同的存储方式提供不同的获取便利性、安全性和成本开销等级。 在大多数场景中,四种存储方式被混合使用以达到最有效的存储策略。 来看一看这四种数据存储方式各自的含义: 1. 在线存储 (Online storage): 有时也称为二级存

[转帖]数据可视化之redash(支持43种数据源) (转自https://anjia0532.github.io/2019/07/08/redash/)

https://www.cnblogs.com/a00ium/p/13177272.html 人类都是视觉动物,讲究一图胜千言。如果没了可视化,那么你在跟领导汇报工作时,很大程度会鸡同鸭讲。其实 excel2016+已经是一个不错的数据分析及可视化工具了(支持几十种数据源),但是,不方便权限控制,集

[转帖][大数据]ETL之增量数据抽取(CDC)

https://www.cnblogs.com/johnnyzen/p/12781942.html 目录 1 CDC 概念 1.1 定义 1.2 需求背景 1.3 考察指标 2 CDC 常见解决方案 2.1 基于时间戳的CDC 【侵入式CDC + 异步CDC】 2.2 基于触发器的CDC 【侵入式C