资料搜集是个相当繁琐与累的工作,也是数据分析入门的基本,良好的信息资料搜集能力有利于我们快速了解基本情况,为后续的调研及一手资料的获得打下较好的基础。今天给大家分享一下,200个可以找数据的网站,建议收藏!1. 搜索关键字的选择举例说明,假如我们要搜索大数据行业发展相关资料,如果我们就在百度上搜索“大数据”,结果非常多,无法进行筛选,可以对关键词进一步界定,如“大数据行业”“大数据市场规模”“中国大数据产业”“大数据技术”“大数据企业”等等,需要不停地变换搜索关键词,直到查到满意的搜索结果。
在查找的过程中可以根据查找结果内容再进行对关键词进行修正,修正有些名称专业表达方式,因为最开始搜索我们表达的不一定准确。
2. 搜索技巧主要是针对百度、google等搜索引擎一些高级搜索技巧。常用技巧主要有如下几个方面:1)文件类型搜索使用filetype,如在百度或google中键入“filetype:pdf 大数据”搜索出有关大数据内容pdf内容,而且这些文档基本都是可直接下载。还可以变换为其他的,如“filetype:doc”“filetype:ppt”“filetype:xls”等等,注意其中的冒号为英文的冒号,一定要变换为英文冒号。
2)定位于哪个网站上搜索使用site,如在百度或google中键入“大数据空格site:sina.com”,则在
http://
sina.com
搜索有关大数据的一些资料信息,这个特别适用针对某些信息可能在哪些网站上出现的一个快速搜索方法,注意冒号也是英文的,网站名称也不用加www。3)精确匹配搜索使用“”,如在百度中键入“大数据行业”,表示搜索“大数据行业”五个必须联在一起的,如果不加“”,搜到的为大数据及行业两个词并列显示结果,没有这么精确匹配。4)限制性的网页搜索使用intitle,如在百度键入“intitie:大数据”,限定于搜索标题中含有“大数据”网页,如果输入“intitie:大数据市场规模”限定于搜索标题中含有“大数据”和“市场规模”的网页。附:搜索引擎推荐
http://
scholar.google.com/
Google学术搜索滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不同版本以及被其它文章的引用次数。略显不足的是,它搜索出来的结果没有按照权威度(譬如影响因子、引用次数)依次排列,在中国搜索出来的,前几页可能大部分为中文的一些期刊的文章。
http://www.
scirus.com
Scirus 是目前互联网上最全面、综合性最强的科技文献搜索引擎之一,由Elsevier科学出版社开发,用于搜索期刊和专利,效果很不错!Scirus覆盖的学科范围包括:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等。
http://www.
base-search.net/
base是德国比勒费尔德大学图书馆开发的一个多学科的学术搜索引擎,提供对全球异构学术资源的集成检索服务。它整合了德国比勒费尔德大学图书馆的图书馆目录和大约160个开放资源(超过200 万个文档)的数据。
http://www.
vascoda.de/
Vascoda是一个交叉学科门户网站的原型,它注重特定主题的聚合,集成了图书馆的收藏、文献数据库和附加的学术内容。
http://www.
goole.com/
与google比较了一下发现,能搜索到一些google搜索不到的好东东 。它界面简洁,功能强大,速度快,YAHOO、网易都采用了它的搜索技术。各位可以一试。
http://www.
a9.com
Google在同一水平的搜索引擎。是http://
Amazon.com
推出的,Webresult部分是基于Google的,所以保证和Google在同一水平,另外增加了Amazon的在书本内搜索的功能和个性化功能:主要是可以记录你的搜索历史。
http://www.
findarticles.com/
一个检索免费paper的好工具。进入网页以后,可以看到他有三个功能,driectory web article,其中article对我们很有帮助,你可以尝试输入你要找的文章,会有很多发现的!
http://www.
emolecules.com
在此搜索引擎里可以搜索到超过千万种化学品信息或相应的供应商,与Chemblink有点相似,但提供的化学品理化信息没有Chemblink详细,与其不同的是该搜索引擎可提供化学品结构式搜索(主页上有在线绘制化学结构式的搜索框)。
http://www.
ojose.com/
OJOSE 是一个强大的免费科学搜索引擎,通过OJOSE,你能查找、下载或购买到近60个数据库的资源。但是感觉操作比较复杂。
http://
citeseer.ist.psu.edu/
一个关于计算机和信息科学的搜索引擎。
http://
hpsearch.uni-trier.de/
专家个人主页搜索引擎。
- 目前万德数据库主要定位于国内高端客户,市场占有率较高,80%左右,当然其售价较高。
- 恒生聚源也定位为机构客户,性价比较高,售价要比万德便宜的多。
- CSMAR数据库定位于学术与高校,其中金融数据比较全,强大。
- 锐思数据库定位于学术,质量一般。
- 巨潮数据库为深交所旗下数据库,有一定的特殊优势。
国外数据库中彭博是比较全也大的,在国内销售也较好,但是售价奇贵。一般不做国际市场研究,大多用不到国外数据库,毕竟国外数据库公司对国内的行业数据及公司数据不如本土数据库公司的做得好。2. 学术数据库学术数据库基本为高校、研究机构所用,也分为国内与国外两大类,学术数据库中一些学术论文、行业数据、统计年鉴还是有用的,缺点就是其中有些数据的相对较旧,无法做到实时更新。1)国内学术数据库
- 中国知网:国内最大学术数据库,包括期刊、学位论文、统计年鉴等
- 万方数据:仅次于中国知网,包括期刊、学位论文等
- 人大复印资料:期刊、论文等
- 维普:期刊、论文等
- 中经网:有较多行业研究报告,宏观数据较全
- 国研网:数据较为权威,有些报告可以一看
- 上海公共研发平台:可以注册,人工审核,内包含较多数据库
- EBSCO:较全的一个数据库,内包含较多的商业数据,好用
- Elsevier:学术文章全,更新速度快
- 数据汇:国内的宏观数据,国外的也有一部分,可以导出来,免费好用。
http://www.
shujuhui.com/database/
- 数据圈:免费共享平台,行业研究报告,统计年鉴等
http://www.
shujuquan.com.cn/
- FRED
http://
research.stlouisfed.org
/fred2/
- OECD图书馆
http://www.
oecd-ilibrary.org/econo
mics
- 台湾学术数据库:部分文章提供免费全文下载
http://
fedetd.mis.nsysu.edu.tw
/
- 台湾大学电子书
http://
ebooks.lib.ntu.edu.tw/H
ome/ListBooks
- 百度文库
http://
wenku.baidu.com/
- 豆丁文库
http://www.
docin.com/
- 爱问共享
http://
ishare.iask.sina.com.cn
/
- 道客巴巴
http://www.
doc88.com/
- 智库文档
http://
doc.mbalib.com/
- 文库大全
http://www.
wenkudaquan.com/
- IT168文库
http://
wenku.it168.com/
- CSDN
http://www.
csdn.net/
- 呱仕网
http://www.
guasee.com/
- 新浪地产
http://
dichan.sina.com.cn/
- Scribd
http://www.
scribd.com
- Docstoc