数据库 -

mysql文件

参数文件

mysql 启动时会按照一定的顺序在指定位置读取配置文件,查看方式为:mysql –help | grep “my.cnf”;关于数据目录,日志文件等应通过配置文件查找.

日志文件

错误日志遇到问题,应该第一时间查看错误日志. 错误日志的位置可以从配置文件中查找,也可以通过 show variables like ‘log_error’\G 命令定位.
慢查询日志默认慢查询日志并未开启.对于未经过索引的查找也可以记录的慢查询日志中.也可以将慢查询日志记录到数据库slow_log中 log_slow_queries:慢查询日志位置 long_query_time :慢查询日志时间 log-queries-not-using-indexes :是否记录未经索引查询

查询日志

查询日志由general_log参数控制,查看方式为 show variables like ‘%general_log%’\G 该日志对性能有一定影响,默认文件名为:主机名.log

二进制日志

对数据库的更改操作都会记录到该文件中

套接字文件

show variables like ‘%socket%’\G

PID文件

show variables like ‘%pid_file%’\G 可以用于mysql服务的pid

InnoDB存储引擎文件

表空间文件

默认为ibdata1

重做日志文件

默认为 ib_logfile0,ib_logfile1

事务

ACID:原子性（Atomicity）一致性（Consistency）隔离性（Isolation）持久性（Durability）并发一致性问题:脏读、不可重复读、丢失更新

索引

B+树索引、全文索引、哈希索引 B+树索引只能找到一个给定键值所在的具体行聚集索引上的扫描属于表扫描，辅助索引上的扫描属于索引扫描

B+树索引

聚集索引聚集索引并非物理上连续的，而是逻辑上连续的。页与页之间通过双向链表链接，单页内的记录间也通过双向链表链接聚集索引上对主键的排序查找和范围查找非常快
辅助索引辅助索引的叶子节点存储的是刚行的主键（聚集索引键） B+树应建立在高选择性上（cardinality)
应用数据处理大致可以分成两大类：联机事务处理OLTP（on-line transaction processing）、联机分析处理OLAP（On-Line Analytical Processing） OLTP 系统强调数据库内存效率，强调内存各种指标的命令率，强调绑定变量，强调并发操作； OLAP 系统则强调数据分析，强调SQL执行市场，强调磁盘I/O，强调分区等。联合索引 sql索引选择上，优先选择索引字段小的值,如字符串的辅助索引和整形的辅助索引，应优先选择整形索引，因为一个磁盘页上可以存放更多整形数，从而减少读取磁盘的次数(所以有可能不应该用字符串当做主键) 覆盖索引，统计,ICP优化(index condition pushdown)
哈希索引

dba无法干预哈希索引的建立

倒排索引

通常利用关联数组实现

主键选择

非分布式架构直接套用自增id做主键小规模分布式架构用uuid或者自增id+步长做主键大规模分布式架构用自建的id生成器做主键，参考twitter的snowflake算法

异常

牢记，默认情况下，InnoDB存储引擎不会回滚超时引发的错误异常

insert/change buffer

需要满足两个条件：1.索引是辅助索引；2.索引不是唯一索引

double write

重做日志中记录的是对页的物理操作，如果页已经损坏，重做是无意义的，必须先恢复该页，再重做

innoDB 本身提供的约束

Primary Key
Unique Key
Foreign Key
Default
Not NUll

存储引擎

存储引擎基于表的，而非数据库

表空间

表空间由段、区、页、行组成. 默认情况下，innoDB只有一个共享表空间ibdata1. 段：数据段，索引段，回滚段等数据段即B+树的叶子节点索引段即B+树的非叶子节点区：连续页组成的空间页：innoDB管理磁盘的最小单位

事务的实现

隔离：由锁实现原子性，持久性：由redo实现一致性：由undo实现

redo:回复提交事务修改的页操作 undo:回滚记录到某个特定版本

数据库中有一种特殊的“日志文件”叫 Redo（重做） Undo（撤销），传统意义上的日志文件是记录系统运行状态的，主要用于系统工程师或者程序员排错。而 Reod/Undo 文件是数据库的一部分，主要用于数据恢复，保证数据的一致性和完整性。

用途

当执行 Insert、Update、Delete 动作时数据库不会真的去数据文件中执行 I/O 操作，而是分了两部分：

修改内存中的数据（数据库称为 Buffer）

记录 Redo Undo 日志

只有当 Buffer 达到刷新条件（比如脏数据达到一定比例）才会对数据文件进行操作。数据库这么设计是出于性能考虑，因为读写数据文件是一次随机 I/O会降低系统性能；虽然 Redo Undo 也会写文件，但它是顺序写入，性能比较高。这种顺序写入一般采用 LSM （Log Structured Merge Trees）算法，比如 Kafka，HBase、LevelDB 都采用这种结构。因为数据并没有真正的写入数据文件，所以当数据库系统崩溃后（比如断电、系统重启、介质错误），数据库系统会利用Redo、Undo 恢复数据。

如何恢复

两个原则

从前向后读取 Redo，重做所有已提交的事务

从后往前读取 Undo，回滚未提交的事务

数据库

mysql