博文

目前显示的是 四月, 2017的博文

R 连接 redis

library(rredis) redisConnect(host = '127.0.0.1',port = 6379) redisKeys() redisDBSize()

R 连接 Mongodb

library(RMongo) mongo <- mongoDbConnect("local") dbShowCollections(mongo) results <- dbGetQuery(mongo, "startup_log", "{}", 0, 2) dbDisconnect(mongo)

R 连接 MySQL

library(RMySQL) library(psych) conn <- dbConnect(MySQL(),dbname="douban",user="root",password="52332580",host='127.0.0.1') dbWriteTable(conn, name = 'Test', value = as.data.frame(Thurstone)) dbGetQuery(conn,"select * from Test") dbDisconnect(conn)

判断数据是否服从某一分布

图片
 1、原理    对于不同的分布,有特定的偏度(skewness)和峰度(kurtosis),正态分布、均匀分布、逻辑斯谛分布、指数分布的偏度和峰度都是特定的值,在偏度-峰度图中是特定的点,而伽马分布和对数正态分布在偏度-峰度图中是一条直线,贝塔分布在偏度-峰度图中是一片区域。因此可以通过未知分布的偏度峰度值(在图中是一个观察点),与各种分布的偏度峰度点(线、区域)进行对比,判断未知分布数据大致可能的一个或几个分布。 2、R语言实现 library(fitdistrplus) x<-c(0.8,11.7,2.8,11.9,6.1,1,      34.8,3.8,5.2,15.0,10.3,12.3,      8.2,0.6,1.7,14.5,8.3,28.9,      3.1,7.3,10.2,8.9,0.1,15.5,      5.7,0.7,8.3,0.9,40.7,2.9) descdist(x) #观察点接近的分布有gamma分布和指数分布 #fitdist对特定分布的服从程度 fitdist(x, "gamma") fitdist(x, "exp") Std.Error(标准误)更小。所以数据更服从指数分布。