天天看点

另类数据的崛起——CnOpenData在行动(上)

由《中国互联网发展报告(2019)》可知,我国2018年的数字经济规模为31.3万亿元,占国内生产总值的34.8%,在体量如此之大的数字经济中,数据要素的流通和交易难免显得意义深重。单就金融领域而言,拥有独特而重要数据的交易者比其他人更具优势,“信息优势”是最直接、便捷的获利方式。

“另类数据”的概念也同样来自于金融业:

另类数据(Alternative Data)

金融业的替代数据是指任何传统上不认为是金融数据但仍能为投资者提供市场洞察力的数据。它通常是相当“原始”的,这意味着投资者必须进行数据挖掘或数据科学来获取洞察力。

—维基百科
           

区别于传统金融数据(如财报、行情数据),能够体现崭新Alpha因子的的另类数据显然更加具有“信息优势”。摩根大通量化研究部将另类数据归为以下三类:

1.个人产生数据(Data generated by individuals):社交媒体、新闻稿和评论、搜索引擎数据、网络搜索量和点击率等;

  • CnOpenData地方留言文本数据简介
  • CnOpenData中国电影票房数据简介
  • CnOpenData电影评分数据
  1. 商业过程数据(Data generated by business process):交易记录和信用记录等;
  • 数据简介| CnOpenData中国小区及二手房交易数据
  • CnOpenData土地交易数据简介
  • CnOpenData·PPP项目数据简介
  1. 高科技监测数据(Data generated by sensors):卫星监测图像、地理定位和气候变化数据等;
  • 免费数据 | CnOpenData中国历史天气数据简介
  • CnOpenData台风数据简介 |文末福利!
  • 免费数据 | CnOpenData空气质量站点监测数据简介
  • CnOpenData人口迁徙大数据简介

上述场景的具体应用在此不再赘述,不可否认的是另类数据带来的信息优势最终落点之处在于其能够给数据使用者带来相当高的sharp ratio,这也就推动着另类数据产业的发展。

在探讨这个话题之前,让我们先来看两张图:

图片

图片

图片来源:https://alternativedata.org

以上是国外一家另类数据网站做的行业统计图,它们分别体现了近年来世界范围内另类数据需求端和供给端的变化趋势,双方数量的井喷式增长无疑都指向一个信号——另类数据正在崛起。

在GPU、大数据、机器学习等重要因素的催化下,另类数据在当今数字化社会的迅速发展显得尤为合理:数据获取难度降低、更新频次提高,数据清洗能力的增强也使数据的结构化运用更加理所当然,这意味着数据抓取能力出色的数据供应商更容易赢得需求端的青睐。

在金融业,另类数据常常应用于盈利预测与风险预警,而在学术界,另类数据也已经成为学者们在顶刊上发文的一块重要敲门砖。

这对于作为另类数据提供者的CnOpenData而言无疑是一个好消息:深厚的学术底蕴、专业的数据抓取能力——我们恰逢其会。

值此之际,本文单就CnOpenData一些特色性较强的数据做简单列示:

1.专利系列数据

  • CnOpenData中国专利创新数据简介
  • CnOpenData中国专利文本数据简介
  • CnOpenData绿色专利创新数据简介
  • CnOpenData中国专利引用数据(中国版)简介
  • 数据时间更新提醒 | CnOpenData中国专利引用数据(世界版)简介
  • 数据时间更新提醒 | CnOpenData上市公司专利及引用被引用数据简介
  • CnOpenData上市公司绿色专利及引用被引用数据
  • CnOpenData中国工业企业专利及引用被引用数据简介 |文末福利!

专利系列数据对于创新的课题研究贡献非常大,专利不仅是对创新成果的保护,也兼具对创新成果进行计量的功能,因此国内外顶级期刊文献和智库报告均将专利数量作为衡量国家和企业创新水平的重要指标之一。近年来,有关于创新的课题在《经济研究》《管理世界》等高质量刊物上陆续发文。

相关文献

  • 周开国、卢允之、杨海生:《融资约束、创新能力与企业协同创新》,《经济研究》,2017年第07期。
  • 余明桂、钟慧洁、范蕊:《业绩考核制度可以促进央企创新吗?》,《经济研究》,2016年第12期。
  • 黎文靖、郑曼妮:《实质性创新还是策略性创新?——宏观产业政策对微观企业创新的影响》,《经济研究》,2016年第4期。
  • 刘波、李志生、王泓力、杨金强:《现金流不确定性与企业创新》,《经济研究》,2017年第03期。
  • 杨道广、陈汉文、刘启亮:《媒体压力与企业创新》,《经济研究》,2017年第08期。

    相关链接

  • 《中国工业经济》观点精粹 |环境规制实现了绿色技术创新的“增量提质”吗
  • 【香樟推文2088】大型企业入驻能够缓解当地经济下行压力吗?

2.银行系列数据

  • CnOpenData中国银行网点全集数据简介
  • CnOpenData银行分支机构违规被处罚数据简介

    经济繁荣离不开银行等金融机构的广泛参与,银行网点的分布、违规被处罚的情况等相关资料成为银行研究的重要资源。银行网点所处的环境、掌握的资源及配置效率可以用来判定银行的竞争力;作为金融业重要的参与主体,银行的风控及监管属于金融研究中不可忽视的一部分。我司的银行数据至少可以用来做以上两个方面的研究。

    相关文献

  • 边文龙、沈艳、沈明高,2017:《银行业竞争度、政策激励与中小企业贷款——来自14省90县金融机构的证据》,《金融研究》第1期。

    -蔡竞、董艳,2016:《银行业竞争与企业创新——来自中国工业企业的经验证据》,《金融研究》第11期。

  • 方芳、蔡卫星,2016:《银行业竞争与企业成长:来自工业企业的经验证据》,《管理世界》第7期。
  • 尹志超、钱龙、吴雨,2015:《银企关系、银行业竞争与中小企业借贷成本》,《金融研究》第1期。

    3.气象系列数据

  • 免费数据 | CnOpenData中国历史天气数据简介
  • 免费数据 | CnOpenData空气质量站点监测数据简介
  • CnOpenData台风数据简介 |文末福利!

    绿色发展一直是我国经济发展中不可忽视的一方面,把环境与经济学研究结合的的文章近年来持续在众多顶刊上发表。而天气、空气、自然灾害等话题无一不指向环境问题研究,本系列数据包含中国历史天气、空气质量站点监测、台风数据等数据,为相关研究提供优质数据支持。

    相关文献

  • Dong, R., Fisman, R., Wang, Y., and Xu, N.H., 2019, “Air pollution, affect, and forecasting bias: Evidence from Chinese financial analysts”, Journal of Financial Economics, forthcoming.
  • Huang, J. K., Xu, N. H., and Yu, H.H., 2019, “Pollution and performance: Do investors make worse trades on hazy days?”, Management Science, forthcoming.
  • 黄溶冰、赵谦、王丽艳,2019:《自然资源资产离任审计与空气污染防治:“和谐锦标赛”还是“环保资格赛”》,《中国工业经济》第10期。
  • 沈永建、于双丽、蒋德权,2019:《空气质量改善能降低企业劳动力成本吗?》,《管理世界》第6期。
  • Han, B., D. Kong and S. Liu, 2018, “Do Analysts Gain an Informational Advantage by Visiting Listed Companies?”, Contemporary Accounting Research, Vol.35(4), 1843-1867.
  • 陈诗一、林伯强,2019:《中国能源环境与气候变化经济学研究现状及展望——首届中国能源环境与气候变化经济学者论坛综述》,《经济研究》第7期。
  • 薄凡、庄贵阳、禹湘,2018:《气候变化经济学研究前沿与教材体系建设——第二届气候变化经济学学术研讨会综述》,《经济研究》第11期。
  • Elloitt,R.J.R.,et al.(2019).“Estimating the direct and indirect impact of typhoons on plant performance:Evidence from Chinese manufactures.” Journal of Environmental Economics and Management 98:102252.

    相关链接

  • 中国城市空气质量改善的产业结构效应——基于新冠疫情冲击的自然实验
  • 【香樟推文2101】空气污染与劳动力迁移
  • 【香樟推文2106】向污染宣战:中国近五年来的污染治理成效

4.分地区数据

  • 免费数据 | CnOpenData中国历年行政区划数据简介
  • 数据简介 | CnOpenData各地区最低工资数据

    中国历年行政区划数据及各地区最低工资数据是研究区域经济发展水平、劳动力市场等问题的基础性数据。以宏观视角研究区域经济,这对于宏观及微观经济学者都是极为重要的一点。

    相关链接

    -【香樟推文2099】美国房价约束导致的劳动力空间错配及其启示

  • 【香樟推文2107】低技能劳动力会被取代吗?以最低工资为视角的研究

5.土地数据

  • 数据简介| CnOpenData中国小区及二手房交易数据
  • CnOpenData土地交易数据简介

从二手房及土地交易视角窥探我国房地产行业的发展状况,是CnOpenData土地系列数据最有价值的研究方向,研究范围包含房地产政策调控、住房金融、房产价格、房地产市场流通、住宅产业现代化等多个方面。除此之外,本系列数据同样给城市发展状况、城镇化进程、区域经济发展等方面研究提供优质数据支持。

继续阅读