什么是数据库?数据库是将大量的数据储存起来,通过计算机加工成可以高效访问的数据集合。举个例子:经常我们在网上某个店家买过一次东西,那么就会在定期或者不定期的时候,收到店家的短信轰炸。
尤其是在61双十一这样的大促时候,狂轰乱炸的短信从凌晨一直持续到深夜。
这个营销动作对商家来说,是CRM(客户关系管理),或者简单明了:短信营销。这个现象背后的逻辑很清楚。即购物平台将消费者的每一次购物记录的明细(包括购物时间、购买的SKU、价钱、数量、总金额、收货地址等)全部存储起来。
然后,再通过软件或插件(背后是运算的逻辑)从大量的历史数据中快速获取营销用户的信息,做定向的推广。
像这样将海量的数据进行储存,并可以通过计算机系统高效访问的数据集就是数据库(Database,DB)。将用户的所有购买记录都存储在数据库中,就能够快速高效地获取想要的数据。用来管理数据库的计算机系统就是数据库管理系统(Database Management System,DBMS)。
数据库广泛存在由于互联网的普及,和互联网大厂在人们生活中方方面面的渗透,现在数据库已经广泛存在和被使用。1. 以我之前所在的某大型房产中介公司为例,其中数据库包括的内容有:员工基础信息、楼盘基础数据、客户基础数据、带看明细记录、成交签约记录等等。
每一个方面拓展开来,每天都有大量的数据积累下来,存在数据库里。
这就成了数据分析和建模的基础。公司的运营决策很大程度上都取决于对这些数据的挖掘和分析。2. 再感受下售楼处的数据库使用水平:新闻:售楼处藏人脸识别系统:360度无死角抓拍而且,关系数据库可以使用SQL语言(Structured Query Language,结构化查询语言)对数据库里的明细数据进行各种各样的操作。
(数据分析师的一大部分工作都在做这个。)比较具有代表性的关系数据库管理系统(Relational Database Management System,RDBMS)有5种,分别如下:
- Oracle Database:甲骨文公司的RDBMS
- SQL Server :微软公司的RDBMS
- DB2:IBM 公司的RDBMS
- PostgreSQL:开源的RDBMS
- MySQL :开源的RDBMS
如下图:RDBMS是一种服务器,可以从保存在硬盘等设备上的数据库中读取数据,还可以根据不同的需求对数据进行处理后再返回。访问由RDBMS管理的数据库,进行数据读写的程序叫做RDBMS客户端。通过将对应的SQL语句发送给RDBMS服务器,RDBMS客户端可以获取到需要的数据,或者对数据库的数据进行增删改等操作。多个客户端可以访问同一个RDBMS,同时对数据库中的数据进行读写操作。
另一方面,RDBMS需要同时接收多个客户端的请求,还需要操作数据量巨大的数据库,因此企业通常会把RDBMS安装在性能更加优越的计算机上。有的时候,当操作的数据量达到一定量级时,还需要将多台计算机组合使用。