中国数据体量有多大?
1. 国家层面,有各类数据库、平台支撑;地方层面基础薄弱。
2. 政府数据多,企业数据很少。政府数据主要是内部使用,或者只允许特定机构使用,企业数据由于涉及商业秘密或合规性要求等往往很难直接获取。 但即使如此,仍有大量行业和企业数据是可以获得的。比如,企业数据中最为丰富的是消费行为数据,如阿里云大数据市场中就有包含淘宝、天猫、支付宝、飞猪、淘粉吧等平台的用户行为数据,覆盖范围广,样本量极大(几亿级别),可以用于多种类型的分析。一些垂直领域的信息也比较容易找到,例如金融领域的企查查、天眼查等就可以方便地查到企业的工商信息、经营状态、涉诉等情况;旅游领域的马蜂窝可以查到旅店评价等信息。有些需要付费,但也有不少是免费的。
3. 在法律法规方面,《中华人民共和国网络安全法》和《互联网信息服务管理办法》中对网络信息的安全保护提出了基本要求,即“健全网络安全保障体系”和“落实网络安全主体责任”。另外,《中华人民共和国反垄断法》对于非公开数据的使用也有相关规定。
4. 关于数据开放与共享,我国目前已经建立了政务数据开放的制度框架,并先后发布了《国务院关于做好政府信息依申请公开工作的意见》(国发〔2010〕5号)、《国务院办公厅关于印发2016年政府信息公开工作要点的通知》(国办发〔2016〕54号)等文件。但由于起步较晚,目前与发达国家相比在数据开放数量和质量上都有一定差距。