首页 > 科技 > 问答 > 科技知识 > 北京国际大数据交易所这样说,人们怎么从大数据中获得利益

北京国际大数据交易所这样说,人们怎么从大数据中获得利益

来源:整理 时间:2022-03-30 11:25:26 编辑:科技知识 手机版

如何从不同角度来理解大数据?

如何从不同角度来理解大数据

近些年来,我国网络购物、移动支付、共享经济等新业态、新模式蓬勃发展,随着各领域对信息化、智能化等深层次应用技术需求的逐渐增大,由此带来的大数据采集、存储、分析、流通等各环节技术创新与升级,利用大数据等信息技术推动信息资源开发、共享。随着移动通讯网络技术快速发展,尤其是5G技术即将商用的重要历史时期,更加快速的通讯网络,更多的设备接入,带来的就是更多的就是数据。

也就是说,大数据是信息化发展的新阶段,随着信息技术和人类生产生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理、国家管理、人民生活都产生了重大影响。互联网对于当今社会发展而言是先进生产力的代表,大数据是重要历史性机遇,也是推动全球经济发展的重要机遇,怎么看重都不过分。

大数据应用中,怎么打破数据孤岛?

如何从不同角度来理解大数据

在很多企业中,信息化建设都已经存在,而且往往存在着不止一个业务系统。比如,ERP系统,CRM系统,HR系统,电商系统等等。虽然每个系统都会有一些自己的查询、分析或报表等功能,但如果想要集中地对数据进行管理和分析,就需要对多个系统进行数据抽取集成来实现。从企业高管的角度来说,他们往往不止是需要简单地看到各业务系统的数据,而是需要对这些数据进行综合汇总、分析、监测,从而做出正确决策。

面对各种来源的数据,很多企业都有对数据进行抽取集成的强烈需求,需要将不同业务系统的数据进行统一的整理和管理,从而能够进行集中的、综合的查询和分析。对于一个企业来说,需要明白数据是从哪里获取数据以及如何获取,数据的来源决定了数据的质量。例如,在企业中,对于人员,公司部门,组织等数据都来自于从HR系统,明确数据的来源是数据治理的第一步。

对数据进行清洗,明确对于不同的目标系统需要用到不同的数据。将重复的,冗余的有价值的数据进行处理和删除。再将最后的数据进行分发,交付给其他业务系统。构建数据分析平台、数据仓库,通过元数据管理、数据建模、数据调度、分析建模、展现配置等功能分析掌握企业销售、经营、财务、成本、计划、人力等运营情况,为经营管理、绩效管理、风险管控等工作提供数据支撑。

整体上帮助企业治理数据,梳理业务流程,提供战略支撑,为后续信息化建设奠定数据基础。数通畅联研发的AEAI MDM基础数据平台是立足于保证数据在各系统中的正确性、重用性和通用性基础上打造的一款核心产品。通过基础数据平台将企业的主数据进行整合,集中进行数据的清洗和标准化,并以集成服务的方式把统一的、完整的、准确的、具有权威性的主数据分发给各业务系统。

大数据时代,如何理解“大数据”?

如何从不同角度来理解大数据

目前阶段大数据技术及体系已经逐渐趋于成熟,不再是以概念贯穿的模式,大数据越来越多的被使用,伴随互联网化的发展更多的企业信息化已经由IT时代转变为DT时代,以数据为核心,用数据进行决策,基于数据驱动企业的创新与发展,相信在将来大数据也会有更广泛的应用空间,对于大数据的理解主要分为以下几个层面。1.数据来源:对于大数据时代而言更多强调基于业务数据的沉淀,在一定规模的数据上进行进一步的分析、处理、转换,更大的挖掘数据本身的价值,发挥数据的意义,当然就企业自身沉淀发展的数据而言很难达到“大”的定义,“大数据”目前更多依然是政府、行业、产业互联等形式获取数据,通过企业内部数据与行业数据的标杆对比实现适合企业自身的发展定位,促进企业自身的发展及业务模式的创新。

2.数据价值:通过产业数据、行业数据的获取、汇聚、处理、分析、归纳,通过一系列技术实现海量数据的快速计算、呈现,将结构化、半结构化的数据进行有效存储,对大量、动态、能持续的数据,通过运用新技术、新模型、新工具进行处理,从而获得具有洞察力和新的价值。更为科学、直观、准确的发挥数据价值,实现以数据为中心的大运营、大整合、大管控的模式支撑。

3.应用方式:目前就大环境而言,大数据更多应用于产业互联、行业分析、政务服务等环节,同时也在不同层面的进入人民的生活中,比如根据个人的兴趣爱好为其推送相关的文档链接,物品模式等。大数据拥有广泛的应用空间,结合大数据的应用进一步为企业、政府、人民生活提供更有针对性、有特色的服务。以数据为支撑作为企业战略的决策的支撑,提高数据汇总的及时性,从而进一步的提升企业的核心竞争力。

大数据时代,研究者如何获取全球视野?

伴随着中国走向世界,并且与世界的经济社会往来越来越密切,各种来自全球的风险与挑战层出不穷,仅仅从维护国家利益的角度来看,研究者在研究过程中纳入全球视野是极有必要的。大数据时代的到来,为研究者观察全球社会的运作提供了极佳机遇,基于大数据的全球社会科学研究逐步有了可能。这将会极大地拓宽社会科学的研究视野,让原本高度依赖本土经验的社会科学研究不再只是“地方性知识”,可是具有整个星球意义上的普适性。

更为重要的是,所有基于大数据的研究,共享同样的数据,研究的可重复性,可检验性得到极大提高,也有助于其研究结论广为接受并得到推广。实际上,从全球比较的层面进行社会科学研究,在社会社科的奠基人那里就有了这样的基因。比如说,在马克思对近现代社会的系统性研究中,全球视野是非常强的。马克思在谈分析1500年发现新大陆之后的世界体系时,最经典的名言莫过于说,旧金山、澳大利亚的金矿与远东的茶叶生产、伦敦的股票市场的变化之间的紧密关联,生产与贸易的全球化,让世界整合成为一个有机关联的体系。

马克思在《资本论》中分析资本主义、殖民主义的运作时,其全球比较视野,全球关联的视野也一以贯之。因为马克思深刻地认识到,要研究资本主义社会,在全球化进程已经开启的时代,缺乏全球的眼光是完全不行的,只有将世界有机关联起来进行研究,从世界体系的角度展开研究,我们才有可能获得完整的知识。在全球化开启的时代,没有任何一个地方可以安于一隅,而会在政治、经济、文化等诸多方面与全球化进程融为一体。

再比如说,在马克斯.韦伯的体系中,全球比较的视野也体现的淋漓尽致。无论是《经济与社会》,还是《比较宗教学研究》,还是他对理性化进程的分析,都显示出高度的全球比较视野。为了说明新教对于资本主义产生的推动作用,他对西欧的天主教、中东的犹太教和伊斯兰教、以及印度的佛教、远东的儒教与道教进行了系统的观察与比较,试图从这样一种全球比较的视野中获得洞见。

可以说,这些学术大家为了论证其观点的可接受性,拓展其理论的想象力,不遗余力地从全球经验来力推其研究视野的拓展,将其理论的经验边界不断拓宽,从而摆脱理论建构的“地方性知识”的困扰。马克思,韦伯的努力是值得敬佩的,也是难能可贵的。因为在经验资料高度碎片化,尤其是不同语言之间经验资料的阅读等难题的限制,以及异域的经验资料获取难度较大时,这种努力就更显得弥足珍贵,这不但需要理论家具有极强的社会学想象力,而且也需要有极强的经验信息驾驭能力。

故而,如果研究者没有极强的学术献身精神,以及敏锐的理论洞察力,要实现这些都是非常困难的。而大数据时代的到来,拓展社会科学的新版图,为全球社会学研究带来了光明的前景。具体而言,大数据时代的到来从以下几个方面推动了全球比较社会学研究。一是互联网作为全球信息的汇聚平台出现,来自于全球的数据信息获取具有了可能性,这为研究人类命运共同体的风险与挑战提供了永无止境的海量信息。

一统天下的互联网,为世界各地的信息交融,社会经济文化交流提供了统一的平台,互联网在不断汇聚世界各个角落的信息,将原本老死不相往来的世界整合成为一个统一的平台,来自世界各种语言的信息在此汇聚,层出不穷的数据产生。在当前,每半年产生的互联网数据信息,等于过去一切时代人类所产生的信息的总和。这对于理解世界各个地方提供了数据来源。

全球社会的生活世界高度整合进入互联网之后,观察世界各地的社会运作逻辑,以及比较世界不同角落人群的心理、行为倾向就具有了可行性。笔者借助于GDELT数据库,刻画2015-2018年间世界上2610多个省的反移民指数。该图清晰地反映,反移民浪潮主要发生在北美和西欧,即西方发达国家阵营,而且,在西欧,反移民指数的空间分布在西欧与中欧之间画下了一道清晰的分界线,这条分界线大致是“丘吉尔”说说的从波罗的海到黑海之间的长长的“铁幕”,也就是东西方世界对抗的分界线。

以GDELT数据库为例,该数据库从2015年开始系统运作,汇聚来自世界所有角落、具有实时性的网络媒介信息,这些信息包括门户网站、网络新闻、广告、广播、博客、网络论坛等,大致包含了全球30多万个类似的媒介来源,以每15分钟更新一次数据,并且将世界上65种语言中的信息进行汇聚,既通过将各种语言翻译成英文进行处理的方式开展自然语言处理,也以自然语言处理的方式直接对不同语言的原始信息进行自然语言处理。

自然语言处理主要包括概率主题模型、情感计算、实体分析等方面,并将这些自然语言处理的数据结果变成研究者可以直接计算的“半结构化数据”。那么,研究者可以用这些具有全球性的数据库做什么呢?根据研究者的不同兴趣,可以从事完全不同的研究。笔者主要从全球比较社会学的角度,谈谈利用此数据库的价值。比如说,从研究人类社会的构成来看,该数据库为对社会生活中最为主要的现象都做了分类,这些分类体系包括;(1) 有关人的分类的,包括语言、种族、阶层、职业、宗教、所使用的货币等等,仅仅从这个角度看,该数据库已经对于社会科学研究中所需要的最为主要的分类已经做了处理,而且随着技术的进一步拓展,还可以进一步拓展分类体系。

(2) 有关人类行为模式以及社会互动模式的,这些人类行为与互动模式的种类包含了社会生活中最为主要的类型,包括个体性的反社会行为、亲社会行为,而关于互动模式的,既包括合作,冲突,以及群体性行为等。有关人类行为模式和社会互动模式的类型高达300多种。(3) 有关人类社会认知、社会情绪等社会心态的,在GDELT数据的GCAM数据库下,总计有18种情感词库,用于从不同的角度测量人类的情绪与认知状态。

这对于研究原本难以量化的情感计算领域,提供极佳机遇。如果从全球比较的角度来看,借助于GDELT的数据库对世界各民族、各种语言的信息都有所涵盖,那么该数据对于我们研究人类生态系统,以及人类社会系统如何运行,就具有了可行性。二是层出不穷的来自于世界各地的数据库被整合,或者原本无法被数字化(data)的信息(information)被数据化。

这些来自于各种语言、各个民族的数据,也为研究者进行全球层面的比较提供了契机。与互联网信息在空间上的超强广度不同的是,这些信息可以在时间上具有极强的跨度。Google Books就是这样的数据库。谷歌图书最初将欧美一些顶级大学的图书馆的馆藏图书进行扫描,逐步将其书籍来源进行扩充,至今已经扫描了世界上9种语言中的3000多万册图书,这一进程还在继续。

人类要了解我们过去的历史以及过去社会的运作逻辑,主要依赖于过去的文字记载。谷歌图书目前的书籍来源在时间上可以扩展到1500年。借助于这些海量的图书信息,及其有助于我们理解过去500年来人类社会运作的方方面面,而且,可以对主要文明和国家的历史进行比较。当然,该数据库目前还没有完全开发,目前主要用于做词频统计。

可以设想,随着该数据库所纳入的书籍信息不断扩充,比如说从现在的3000万册(大致占古登堡印刷术以来人类出版书籍的10%左右),增加到2亿册左右(即占人类出版书籍的2/3),同时在文本信息的自然语言处理方面,也像GDELT数据库那样,从多个维度对数据信息进行提取,可以设想,该数据的威力对于研究全球史的意义与价值。

可以毫不夸张地说,这一定会在史学研究领域带来一场扎扎实实的研究方式革命。借助于Google Books,笔者曾经绘制了1800-1900这100年间世界贸易格局的变迁,以圆圈的大小反映各个城市在贸易格局中的重要性,以城市之间连线的粗细反映贸易互动的频繁程度。左图是1800-1810年(19世纪头10年)的贸易格局,右图是1890-1900年,即19世纪最后10年的贸易格局。

19世纪初,最重要的贸易重镇还是在亚欧大陆的中心城市之间,伦敦、罗马、耶路撒冷构成了这个贸易体系的三个最为核心的节点,三者之间的共现频率远超其他城市;而到了19世界末,最重要的贸易节点已经变成了大西洋两岸的城市,城市之间的双边贸易的集中程度降低了,贸易的总量在极大程度的增加的同时,却分散到了更多的城市之间,而不是像19世纪初期那样高度集中在少数几个关键节点城市。

除了GDELT,Google Books等天文量级的文本数据信息之外,来自于Facebook,Twitter,Wikipedia,Reddit等社交媒体数据、网络论坛数据、网络百科数据,无不可以从全球的层面帮助研究者从数据中获取洞见,获得对“人类生态系统”,或者说“人类命运共同体”的认知。在大数据信息已在全球层面整合、在星球层面覆盖、在各种语言中以指数级增长的背景下,如何从全球的层面提出有意义的问题,从冷冰冰的数据海洋中提取出服务于国家建设的洞见,在当今时代显得尤为关键。

很显然,当前世界意义的数据信息整合主要是由美国主导的,具体而言,是由谷歌、微软等这样的世界级企业主导的,这些大数据信息对于他们认识全球社会如何运作,并服务于其企业的资本运作是“如虎添翼”,同时也服务于其国家利益。而我国学界在这方面的反应目前还颇为迟钝。在“信息就是情报,情报蕴含价值”的时代,我国学术界应该重新“开眼看世界”,这种“开眼看世界”不是像现在所流行的所谓的“国际视野”,而是说,将这种具有全球意义的大数据及其分析技术纳入到我们的研究进程中,提升全球层面的信息驾驭能力,问题发现能力以及理论建构能力,摆脱地方性知识的困扰,提升中国社会科学的学术话语权。

感觉很多教育只是教人知识,可是在大数据时代,获取知识很容易,为什么不教授获取知识的方法和培养学生能力呢?

您提的这个问题非常好,这正是当下学校教育中存在的问题,也是未来教育发展的方向。首先,要明确的是,教知识也是教育要完成的主要任务。教育的主要功能之一,是传承几千年来人类创造的文明成果,以薪火相传,在年轻一代身上发扬广大。有些事实性的知识,学生是可以通过大数据获得的,不用教师教;而有些知识,比如一些条件性知识、策略性知识、规律性知识等,学生只依靠大数据理解不了,不能形成知识系统,也不知道怎样应用,还是需要教师教的。

另外,考试还要考知识,传授知识仍然是教育的主要任务之一。其次,现在教知识也不同于传统的教学方法。传统的知识教学是以讲授和灌输为主,教师只是通过课堂教学,将书本知识搬运到学生大脑中,即完成了教学任务。新课程改革实施十几年来,倡导自主、合作、探究的教学方式和学习方式,要求学生在教师的指导下,以问题为导向,先学后教,主动获取知识,小组学习、合作学习、混合式学习已成为课堂教学的主要组织形式,教师在课堂教学上要根据学生自主学习的情况,精讲点拨,教规律、教方法。

可见,当今的教学虽然还是以教知识为主,但正朝着教方法和培养学生能力的方向发展。再次,无论时代如何发展,都不可低估知识的价值。知识是学生掌握方法、形成能力的工具。现在学校教育提倡培养学生的核心素养,这正是提高学生综合能力的具体化。但是,一个不容忽视的事实是,核心素养的培养要以知识的学习为前提,只有让学生先知,才能后行。

文章TAG:北京国际大数据交易所这样说人们怎么从大数据中获得利益北京北京国际国际

最近更新

  • 手机里的图片都在哪里?,你们手机里的照片都存在哪里

    手机空间释放后,上传到腾讯相册不显示占用空间,手机操作过程中也不会出现卡顿现象。清理手机垃圾时,腾讯相册不会有垃圾,所以整体上没有发现内存占用现象。我给大家分享一个储存照片的好方法 ......

    科技知识 日期:2022-07-20

  • 人为什么要有价值观,一个人存在的价值是什么

    树立正确的人生观和积极的价值观,首先要树立正确的是非观。决定一个人价值观的标准不一样。根本区别在于各自的创造力、精力,差异化的社会分工,利益分配平衡中相对统一的需求。一个人的认识和 ......

    科技知识 日期:2022-07-19

  • 为什么黄牛抢票用什么软件,为什么还会有黄牛抢票

    黄牛使用的抢票软件是独立软件。最后黄牛用的抢票软件和我们的差别很大。我们平时用的软件都是市面上常用的。这些抢票软件都是很多人用的,服务器平均分配后自然减少了我们每个人的份额,这也是 ......

    科技知识 日期:2022-07-18

  • 为什么苹果亮银贵,为什么苹果的数据线这么贵

    你知道为什么苹果的数据线贵但是容易断吗?苹果手机最大的优势就是iOS系统和苹果的A系列处理器。关键是最便宜的苹果数据线官方售价149元。按照大部分苹果数据线不到一年的使用寿命,光是 ......

    科技知识 日期:2022-07-18

  • 谷歌眼镜显示屏在哪里,哪些VR眼镜值得买

    VR眼镜的分类目前VR眼镜主要分为VR盒子VR一体机和PCVR。去的太早了,先发明骑行用的智能眼镜还好,但还没消失。第二代企业版谷歌眼镜高通SnapdraonXR1平台运行,不出售 ......

    科技知识 日期:2022-07-18

  • 上海哪里体验一加手机,一加手机真的快不行了吗

    说到一加,总会有一大批人说一加手机只活在互联网上。比如现实中没有一加手机的踪迹。一加定位,首先你必须是网络爱好者,否则一般没机会看到。其次,一加一直以来都是精品旗舰策略,每一次新机 ......

    科技知识 日期:2022-07-17

  • 为什么冬季雾霾最严重怎么办,夏天难道就没有雾霾吗

    为什么冬天有雾霾,夏天没有?看来雾霾的主要原因还是气象条件。其实冬天的雾霾已经比以前轻很多了。所以直到现在,冬天还是有雾霾。个人认为和农民烧麦秸没关系。入秋以来,随着来自中国的西北 ......

    科技知识 日期:2022-07-17

  • 苹果为什么好用,苹果的系统那么难用

    我用的是苹果安卓,我觉得苹果不好用。我承认苹果系统很流畅,但是旗舰安卓机型还可以,更重要的是也很耐用。苹果系统真的没有安卓系统自由。换了苹果第二天就开始想念安卓了,应用很忙。微信视 ......

    科技知识 日期:2022-07-17