-
神经网络:请不要开始就让我sigmoid(wTx),谢谢!
所属栏目:[大数据] 日期:2021-01-09 热度:187
神经网络:请不要开始就让我sigmoid(wTx),谢谢! 引子 学习机器学习,翻阅了一些神经网络的文章,上来就是sigmoid ( 1 / ( 1 + e x p ( x ) ) )和W T X,让不少初学者摸不着头脑。一些市面上评价很高的机器学习的书也是直接开始sigmoid和收敛性的讨论,想踏[详细]
-
课程丨大数据分析专题Hadoop/MapReduce/Hive原理及应用
所属栏目:[大数据] 日期:2021-01-08 热度:60
? 课程目的 1.掌握Hadoop,Hive以及MapReduce的基本原理及应用; 2.学会在本地与AWS进行交互,并利用AWS Elastic MapReduce进行实战数据分析。 ? 课程项目图 ? 讲师介绍 Eason 卡内基梅隆大学硕士。热衷于研究各类大数据框架,拥有数年AWS开发经验。现就职于[详细]
-
机器学习中的相似性度量!
所属栏目:[大数据] 日期:2021-01-08 热度:197
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。 本文目[详细]
-
HDOJ 1042 N! 大数
所属栏目:[大数据] 日期:2021-01-08 热度:179
Given an integer N(0 ≤ N ≤ 10000),your task is to calculate N!? Input One N in one line,process to the end of file.? Output For each N,output N! in one line.? Sample Input 123 Sample Output 126 思路:没啥思路[详细]
-
[收藏] 值得关注的12大开源大数据分析应用软件
所属栏目:[大数据] 日期:2021-01-08 热度:190
数据挖掘与数据分析 本文来自 51CTO快译, 介绍的这些开源工具是大数据处理、商业智能、机器学习和预测分析等领域的佼佼者。 对于许多大企业来说,开源大数据分析已经成为日常业务中一个必不可少的组成部分。据New Vantage Partners公司对《财富》1000强公司[详细]
-
收藏丨值得关注的12大开源大数据分析应用软件
所属栏目:[大数据] 日期:2021-01-08 热度:109
对于许多大企业来说,开源大数据分析已经成为日常业务中一个必不可少的组成部分。据New Vantage Partners公司对《财富》1000强公司的高层主管开展的调查显示,如今62.5%的企业在生产环境中至少运行一种大数据工具或应用软件。这比2013年给出同样回复的企业数[详细]
-
nuoj 114 大数
所属栏目:[大数据] 日期:2021-01-08 热度:79
数列A满足An = An-1 + An-2 + An-3,n = 3? 编写程序,给定A0,A1 和 A2,计算A99 Input 输入包含多行数据? 每行数据包含3个整数A0,A1,A2 (0 = A0,A2 = 32767)? 数据以EOF结束 Output 对于输入的每一行输出A99的值 Sample Input 1 1 1 Sample Output 6908744247[详细]
-
机器学习和数据分析Python 与 R 编程之间的对比
所属栏目:[大数据] 日期:2021-01-08 热度:114
转载: https://opensource.com/article/16/11/python-vs-r-machine-learning-data-analysis Machine learning and data analysis are two areas where open source has become almost the de facto license for innovative new tools. Both the Python and[详细]
-
时空维度挖掘(二)之 leaflet
所属栏目:[大数据] 日期:2021-01-08 热度:127
概述 本文是时空维度挖掘系列的第二篇,将引进空间挖掘中的重量级嘉宾 leaflet。在互联网竞争日益激烈的今天,一方面,online业务蓝海越来越少,扩展成本也越来越高,许多互联网企业开始介入地推,甚至出现了比如望京扫码一条街这样的经典案例;另一方面,of[详细]
-
直播丨SeniorEngineer全方位解读BigData实习
所属栏目:[大数据] 日期:2021-01-08 热度:70
根据《财富》杂志的报道,就业面广,行行需要,薪金高,工作稳定的Big Data Engineer 已经成为当下最炙手可热的职业。 不仅如此,根据美国劳工统计局的数据显示,Big Data Engineer将是美国工作机会增长最快的工作之一。劳工统计局的最新就业率报告预计, 该[详细]
-
poj2506——Tiling(递推+大数加)
所属栏目:[大数据] 日期:2021-01-08 热度:102
Description In how many ways can you tile a 2xn rectangle by 2x1 or 2x2 tiles? Here is a sample tiling of a 2x17 rectangle. Input Input is a sequence of lines,each line containing an integer number 0 = n = 250. Output For each line of inpu[详细]
-
算法提高 大数加法
所属栏目:[大数据] 日期:2021-01-02 热度:77
问题描述 输入两个正整数a,b,输出a+b的值。 输入格式 两行,第一行a,第二行b。a和b的长度均小于1000位。 输出格式 一行,a+b的值。 样例输入 4 2 样例输出 6 #includestdio.h#includestring.hvoid fun(int n,int sum[]){int temp,i;for(i=0;in;i++){temp=s[详细]
-
[bigdata-031] python3+selenium 做抓取
所属栏目:[大数据] 日期:2021-01-02 热度:165
1. 安装 1.1 pip3 install -U selenium 1.2 下载 https://github.com/mozilla/geckodriver/releases/download/v0.13.0/geckodriver-v0.13.0-linux64.tar.gz? 解压缩,然后放到/usr/bin目录 2. 抓取豆瓣 #!/usr/bin/env python3#!-*- coding:utf-8 -*-import[详细]
-
logminer挖掘
所属栏目:[大数据] 日期:2021-01-02 热度:147
1.???? Logminer介绍 LogMiner 是Oracle公司从产品8i以后提供的一个实际非常有用的分析工具,使用该工具可以轻松获得Oracle 重做日志文件(归档日志文件)中的具体内容,LogMiner分析工具实际上是由一组PL/SQL包和一些动态视图组成,它作为Oracle数据库的一[详细]
-
[bigdata-005] 用docker搭建oracle 11g并提供python3 开发
所属栏目:[大数据] 日期:2021-01-02 热度:194
参考资料 http://www.bubuko.com/infodetail-401514.html 1. docker上的oracle 11g https://hub.docker.com/r/alexeiled/docker-oracle-xe-11g/ 安装和启动命令: 1.1 docker pull alexeiled/docker-oracle-xe-11g 1.2 docker run --name dck-oracle-11g -d[详细]
-
[bigdata-006] 工作流 tez和oozie
所属栏目:[大数据] 日期:2021-01-02 热度:198
1.? 基本状况 Tez是Hortonworks开发的。 董西成的分析 http://dongxicheng.org/mapreduce-nextgen/apache-tez/ http://zh.hortonworks.com/blog/introducing-tez-faster-hadoop-processing/ tez运行在Yarn上的,DAG工作流,底层设计,对Map和Reduce进一步拆[详细]
-
HDoj1047Integer Inquiry(大数连续相加)
所属栏目:[大数据] 日期:2021-01-02 热度:98
Integer Inquiry Time Limit: 2000/1000 MS (Java/Others)????Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 19438????Accepted Submission(s): 5087 Problem Description One of the first users of BIT's new supercomputer was Chip D[详细]
-
读取csv数据并保存成图像
所属栏目:[大数据] 日期:2021-01-02 热度:167
int main(int argc,char* argv[]){ifstream file("******.csv");string value;int i = 0;int j = 0;while (file.good()){getline(file,value,'n');//cout string(value,value.length()) endl;if (i 0){value.erase(0,2);value.erase(value.length() - 9);//[详细]
-
几种大数阶乘算法效率比较(Java)
所属栏目:[大数据] 日期:2021-01-02 热度:144
完整代码: package bigdatamul; import java.math.BigInteger; /** * 大数阶乘 * * @Description : TODO(大数阶乘) * * @author yzy * @date 2016-12-20 上午9:31:14 * */ public class Test { public static void main (String[] args) { //单位:ms //fun[详细]
-
报告一:知识工程与大数据分析
所属栏目:[大数据] 日期:2021-01-02 热度:195
报告一:知识工程与大数据分析 报告人:漆桂林博士,东南大学教授 主要内容:知识工程是人工智能的重要分支之一,知识的获取和基于知识的推理能力是人类高级智能的体现。知识工程涉及到机器学习、知识表示与推理、自然语言处理和数据存储等技术。本报告将介[详细]
-
数据处理之one-hot
所属栏目:[大数据] 日期:2021-01-01 热度:147
分类方法,通常需要把数据的各个属性转换为一个向量表示,这样每条数据的特征就是一个向量,向量上的每个维度就表示了一个特征属性。 但是如果要转换的数据包含了3种属性,比如身高,体重,年龄。A是女,168cm,70kg,30岁;B是男,180cm,90kg,20岁,那么直[详细]
-
米斯特白帽培训讲义 挖掘篇 厂商寻找
所属栏目:[大数据] 日期:2021-01-01 热度:190
米斯特白帽培训讲义 挖掘篇 厂商寻找 讲师:gh0stkey 整理:飞龙 协议:CC BY-NC-SA 4.0 厂商是什么 厂商可以是一个网站(Web 应用),或者一段程序(PC、移动应用)。从白帽子的角度来说,两个都是厂商,都可以挖掘。 基于漏洞平台的寻找 现在国内有三大漏[详细]
-
七牛数据处理再添新兵——图片瘦身
所属栏目:[大数据] 日期:2021-01-01 热度:52
我们现在已经很难想象,图片的出现,竟然只是作为分割文字和缓解疲劳的工具。 随着智能手机的普及,以及像 in、nice 这样以分享图片为主的应用的流行,人们记录生活、分享感悟的方式不再局限于文字,而是逐渐被拍照取代,拍照也不需要那么刻意为之。 无疑,[详细]
-
[bigdata-007] Hortonworks HDF搭建流程
所属栏目:[大数据] 日期:2021-01-01 热度:175
1. hdf docker搭建 1.1 hdf的镜像xemuliam/hdf 镜像链接 https://hub.docker.com/r/xemuliam/hdf/ 下载镜像: docker pull xemuliam/hdf 1.2 创建容器 docker run --name dck-hdf-8080 -p 8080:8080 -d xemuliam/hdf 1.3 进入容器bash交互 docker exec -it d[详细]
-
BI工具选型指标,如何选择好的BI工具
所属栏目:[大数据] 日期:2021-01-01 热度:106
随着信息化的发展,越来越多的企业将商业智能 BI 的部署列入了企业信息化建设的下期目标, BI 市场需求的日益旺盛,也催生了 BI 厂商激烈的市场竞争,带动了国内 BI 工具技术的发展及成熟。 那么作为一个正在或者即将要进行 BI 工具选型的企业,面对百花齐放[详细]
