数据分析

数据分析人员需要掌握sql到什么程度?

了解数据库基本概念,掌握基本的SQL语法,学会使用聚合函数和分组功能,数据清洗和处理,数据库设计和优化,跨平台和跨数据库操作 ......
数据分析 程度 人员 数据 sql

编程最佳外挂:批量数据分析与可视化,CodeGeeX工具箱一键完成

ChatGLM3代模型的Code Interpreter能力,本周已经在VSCode里的CodeGeeX插件产品中,以开发者工具箱的产品形态上线。 下图以VSCode插件为例:在CodeGeeX的侧边栏,和智能问答AskCodeGeeX并列出现的工具箱标签,用户登录后就可以直接打开使用。 Code ......

使用GPT4进行数据分析,竟然被他骗了

上周,OpenAI开发者大会上OpenAI发布了一系列震撼人心的功能。而最让我感兴趣的,就是GPT4的数据分析功能了。话不多说,赶紧上号体验一下。 在最新登录GPT4的时候,都会有下面这个提示,目前已经支持联网,分析数据,生成图片的功能了。这是plus用户都可以使用的。 然后我们可以在上方很容易的选 ......
数据分析 数据 GPT4 GPT

不会这5个Excel函数,别说你会做数据分析?

当涉及数据分析时,Excel是一个非常有用的工具,而掌握一些核心函数将大大提高你在数据处理和分析方面的能力。以下是我对五个重要的Excel函数的详细介绍: 1. VLOOKUP 函数 VLOOKUP 函数是 Excel 中最常用的查找函数之一。它允许你在一个范围内搜索特定的数值,并返回该数值所在行的 ......
数据分析 函数 数据 Excel

基于Spark对消费者行为数据进行数据分析开发案例

原创/朱季谦 本文适合入门Spark RDD的计算处理。 在日常工作当中,经常遇到基于Spark去读取存储在HDFS中的批量文件数据进行统计分析的案例,这些文件一般以csv或者txt文件格式存在。例如,存在这样一份消费者行为数据,字段包括消费者姓名,年龄,性别,月薪,消费偏好,消费领域,购物平台,支 ......
数据 数据分析 消费者 案例 行为

python用支持向量机回归(SVR)模型分析用电量预测电力消费|附代码数据

全文链接:http://tecdat.cn/?p=23921 最近我们被客户要求撰写关于支持向量机回归的研究报告,包括一些图形和统计输出。 本文描述了训练支持向量回归模型的过程,该模型用于预测基于几个天气变量、一天中的某个小时、以及这一天是周末/假日/在家工作日还是普通工作日的用电量 关于支持向量机 ......
用电量 向量 模型 电力 代码

基因表达谱数据分析简介

基因表达谱数据分析是一种研究基因表达模式的技术,它可以帮助科学家了解基因在不同情况下的表达情况。什么是基因表达谱数据分析?基因表达谱数据分析是一种研究基因表达模式的技术,它可以帮助科学家了解基因在不同情况下的表达情况。它可以帮助科学家了解基因在不同情况下的表达情况,从而更好地理解基因如何影响生物体的 ......
数据分析 基因 简介 数据

PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享

全文下载链接:http://tecdat.cn/?p=26219 最近我们被客户要求撰写关于银行机器学习的研究报告,包括一些图形和统计输出。 该数据与银行机构的直接营销活动相关,营销活动基于电话。通常,需要与同一客户的多个联系人联系,以便访问产品(银行定期存款)是否会(“是”)或不会(“否”)订阅 ......
数据 向量 近邻 机器 森林

R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列|附代码数据

原文链接:http://tecdat.cn/?p=26897 最近我们被客户要求撰写关于GARCH的研究报告,包括一些图形和统计输出。 风险价值 (VaR) 是金融风险管理中使用最广泛的市场风险度量,也被投资组合经理等从业者用来解释未来市场风险 风险价值 (VaR) VaR 可以定义为资产在给定时间 ......
时间序列 收益率 序列 收益 模型

R语言EG(Engle-Granger)两步法协整检验、RESET、格兰杰因果检验、VAR模型分析消费者价格指数CPI和生产者价格指数PPI时间序列|附代码数据

全文链接:http://tecdat.cn/?p=31108 原文出处:拓端数据部落公众号 作为衡量通货膨胀的基本指标,消费者价格指数CPI和生产者价格指数PPI的作用关系与传导机制一直是宏观经济研究的核心问题。 对此问题的研究显然具有重要的学术价值与现实意义:当PPI先行地引导着CPI的变动,则意 ......

股市数据分析的神器

一. 安装方法 安装Tushare非常简单,只需要在终端输入以下代码即可: pip install tushare 1. 获取股票行情数据 想要获取某一只股票最近几天的行情数据,只需要使用以下代码: import tushare as ts data = ts.get_hist_data('6005 ......
数据分析 神器 股市 数据

TSINGSEE智能分析网关V4车辆结构化数据检测算法及车辆布控

若在划定区域内检测到车辆(支持检测轿车、卡车、大巴、自行车、三轮车、摩托车、电动车等车型),并达到触发告警的时间,则立即上告消息并展示在告警中心。 ......
车辆 网关 算法 TSINGSEE 结构

基于三维点云数据的主成分分析方法(PCA)的python实现

https://github.com/mengxingshifen1218/learning-pointcloud/blob/master/%E6%B7%B1%E8%93%9D/CH1/PointCloudHomework1/pca_normal.py KD-Tree原理详解 https://zhu ......
成分 方法 数据 python PCA

R数据分析:净重新分类(NRI)和综合判别改善(IDI)指数的理解

对于分类预测模型的表现评估我们最常见的指标就是ROC曲线,报告AUC。比如有两个模型,我们去比较下两个模型AUC的大小,进而得出两个模型表现的优劣。这个是我们常规的做法,如果我们的研究关注点放在“在原模型新引入一个预测变量,模型的效果会不会提高时”,这个时候ROC就常常会显得力不从心,因为通常加入一 ......
数据分析 指数 数据 NRI IDI

上海、国际新冠疫情数据分析可视化

原文链接:https://tecdat.cn/?p=34192 原文出处:拓端数据部落公众号 分析师:Junjie Chen 新冠疫情的发展情况已经成为人们目前最密切关注的问题之一,疫情的历史数据以图形的形式进行对比和呈现能够让客户直观地了解各地区疫情的发展情况。 解决方案 任务/目标 分析上海各区 ......
数据分析 疫情 数据 国际

R语言Copula模型分析股票市场板块相关性结构|附代码数据

原文链接:http://tecdat.cn/?p=25804 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于Copula的研究报告,包括一些图形和统计输出。 这篇文章是关于 copulas 和重尾的。在全球金融危机之前,许多投资者是多元化的。看看下面这张熟悉的图: 黑线是近似正态的。红线代 ......
相关性 股票市场 板块 模型 语言

matlab用Logistic逻辑回归建模和马尔可夫链蒙特卡罗MCMC方法分析汽车实验数据

原文链接:http://tecdat.cn/?p=24103 原文出处:拓端数据部落公众号 此示例说明如何使用逻辑回归模型进行贝叶斯推断。 统计推断通常基于最大似然估计 (MLE)。MLE 选择能够使数据似然最大化的参数,是一种较为自然的方法。在 MLE 中,假定参数是未知但固定的数值,并在一定的置 ......
Logistic 逻辑 方法 数据 matlab

R语言群组变量选择、组惩罚group lasso套索模型预测分析新生儿出生体重风险因素数据和交叉验证、可视化

原文链接:http://tecdat.cn/?p=25158 原文出处:拓端数据部落公众号 本文拟合具有分组惩罚的线性回归、GLM和Cox回归模型的正则化路径。这包括组选择方法,如组lasso套索、组MCP和组SCAD,以及双级选择方法,如组指数lasso、组MCP。还提供了进行交叉验证以及拟合后可 ......
套索 新生儿 变量 体重 模型

R语言逐步多元回归模型分析长鼻鱼密度影响因素|附代码数据

原文链接:http://tecdat.cn/?p=9564 最近我们被客户要求撰写关于多元回归的研究报告,包括一些图形和统计输出。 我从马里兰州生物流调查中提取了一些数据,以进行多元回归分析。数据因变量是每75米长的水流中长鼻鱼(Rhinichthys cataractae)的数量。自变量是河流流失 ......
密度 模型 因素 语言 代码

经营数据分析需要分析哪些数据?

经营数据分析需要分析销售数据、财务数据、市场数据、运营数据、员工数据和用户数据等不同类型的数据。通过深入分析这些数据,企业可以获取有价值的见解和洞察,从而做出更明智的决策,并优化业务运营。 ......
数据 数据分析

商务大数据分析是什么?答案就在这里!

商务大数据分析是指利用大规模、多样化的数据资源,运用统计学、数据挖掘、机器学习等技术手段,对商务活动中产生的各类数据进行深入分析和解读,以获取有关商务决策的洞察和见解的过程。商务大数据分析的目标是通过对大数据的挖掘和分析,揭示商务运营中潜在的商机和风险,并为企业提供可操作的决策依据。它关注的范围包括 ......
数据分析 答案 数据 商务

【专题】2023中国机器人产业分析报告PDF合集分享(附原数据表)

原文链接:https://tecdat.cn/?p=34144 原文出处:拓端数据部落公众号 仿生机器人作为一类结合了仿生学原理的机器人,具备自主决策和规划行动的能力,正逐渐进入大众视野。它们的核心技术要素包括感知与认知技术、运动与控制技术、人机交互技术和自主决策技术。 阅读原文,获取专题报告合集全 ......

【专题】2022年中国扫地机器人市场竞争分析报告PDF合集分享(附原数据表)

原文链接:https://tecdat.cn/?p=34144 原文出处:拓端数据部落公众号 仿生机器人作为一类结合了仿生学原理的机器人,具备自主决策和规划行动的能力,正逐渐进入大众视野。它们的核心技术要素包括感知与认知技术、运动与控制技术、人机交互技术和自主决策技术。 阅读原文,获取专题报告合集全 ......

python用支持向量机回归(SVR)模型分析用电量预测电力消费|附代码数据

全文链接:http://tecdat.cn/?p=23921 最近我们被客户要求撰写关于支持向量机回归的研究报告,包括一些图形和统计输出。 本文描述了训练支持向量回归模型的过程,该模型用于预测基于几个天气变量、一天中的某个小时、以及这一天是周末/假日/在家工作日还是普通工作日的用电量 关于支持向量机 ......
用电量 向量 模型 电力 代码

代谢组学数据分析合集

代谢组学(Metabolomics)是在20世纪90年代末兴起的新兴学科,它是在基因组学和蛋白质组学之后发展起来的一项新的组学技术,同时也是系统生物学的重要组成领域。 代谢组学探讨了在生物体受到干扰后(如基因改变或环境变化)其内源性代谢物种类、数量和变化规律。它着眼于研究生物整体、器官或组织中代谢途 ......
数据分析 数据

Databend + lakeFS:将数据版本控制嵌入你的分析工作流

作者:尚卓燃(PsiACE) 澳门科技大学在读硕士,Databend 研发工程师实习生 Apache OpenDAL(Incubating) Committerhttps://github.com/PsiACE 云计算为以数据为中心的应用提供了廉价、弹性、共享的存储服务,这为现代数据处理工作流提供了 ......
工作流 Databend 版本 数据 lakeFS

【专题】2022年新能源智能汽车及自动驾驶竞争分析白皮书-新四化浪潮来袭报告PDF合集分享(附原数据表)

原文链接:https://tecdat.cn/?p=34111 随着新一轮技术革命和产业变革的推动,以及国家政策的大力扶持,电动化、智能化、网联化已经成为汽车行业发展的新趋势。在这种背景下,各大企业纷纷争夺数字化人才,以推动产品的规模化落地和商业化创新应用。阅读原文,获取专题报告合集全文,解锁文末5 ......
白皮 四化 数据表 白皮书 新能源

【视频】R语言生存分析原理与晚期肺癌患者分析案例|数据分享|附代码数据

原文链接:http://tecdat.cn/?p=10278 最近我们被客户要求撰写关于生存分析的研究报告,包括一些图形和统计输出。 生存分析(也称为工程中的可靠性分析)的目标是在协变量和事件时间之间建立联系 生存分析的名称源于临床研究,其中预测死亡时间,即生存,通常是主要目标。 视频:R语言生存分 ......
数据 肺癌 患者 原理 案例

R语言数量生态学冗余分析RDA分析植物多样性物种数据结果可视化

原文链接:http://tecdat.cn/?p=25564 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于生态学冗余分析RDA的研究报告,包括一些图形和统计输出。 冗余分析(redundancy analysis,RDA)是一种回归分析结合主成分分析的排序方法,也是多因变量(multir ......
生态学 冗余 多样性 物种 数量

Eviews回归分析股权集中度、股权制衡度与公司绩效关系:中小板上市公司数据

全文链接:http://tecdat.cn/?p=32345 原文出处:拓端数据部落公众号 本文深入分析了国内外关于股权结构与公司绩效的影响因素; 帮助客户运用回归分析法,以ROE作为公司绩效的度量指标,考察中小企业板上市公司股权集中度、股权制衡度对公司绩效的影响因素。 为了进行实证研究,选取了部分 ......
股权 集中度 公司 绩效 上市公司