面试题

索引设计原则,主从读写分离,垂直分区,水平分区,负载均衡,反向代理,分布式部署,nginx,lighttpd

索引设计原则

http://dev.firnow.com/course/7_databases/mysql/Mysqljs/20090820/168951.html

1. 最合适的索引列是在查询语句中的条件部分经常出现的列。
2. 使用唯一值索引。即列值尽可能具有唯一性。
3. 使用短索引。如需索引字符串,尽量使用尽可能短的但是能区分列值的长度。较短的列值意味着,缓存中能存放更多的值,也就增加的命中率。
4. 利用最左前缀。如果创建了多列索引(n列),则其最作列集也可作为索引来使用。
5. 不要过度索引。修改表时数据库需要更新索引,过度的索引不但耗费额外的空间,而且降低了修改更新操作的效率。
6. InnoDB中数据按默认顺序存放,尽量设置主键。如果设置了主键,则innodb按主键顺序存放;如果没有,则按唯一索引存放。
7. Btree(默认)适合范围搜索,Hash适合单值搜索。

 

主从读写分离、垂直分区、水平分区

http://itsoul.javaeye.com/blog/777208

1、读写分离:当数据库访问量还不是很大的时候,我们可以适当增加服务器,数据库主从复制的方式将读写分离; (可用mysqlproxy

2、垂直分区:当写入操作一旦增加的时候,那么主从数据库将花更多的时间的放在数据同步上,这个时候服务器也是不堪重负的;那么就有了数据的垂直分区,数据的垂直分区思路是将写入操作比较频繁的数据表,如用户表_user,或者订单表_orders,那么我们就可以把这个两个表分离出来,放在不同的服务器,如果这两个表和其他表存在联表查询,那么就只能把原来的sql语句给拆分了,先查询一个表,在查询另一个,虽然说这个会消耗更过性能,但比起那种大量数据同步,负担还是减轻了不少;

3、水平分区:但是往往事情不尽人意,可能采取垂直分区能撑一段时间,由于网站太火了,访问量又每日100w,一下子蹦到了1000w,这个时候可以采取数据的进行分离,我们可以根据user的Id不同进行分配,如采取%2的形式,或者%10的形式,当然这种形式对以后的扩展有了很大的限制,当我由10个分区增加到20个的时候,所有的数据都得重新分区,那么将是一个的很庞大的计算量;以下提供几种常见的算法:
  哈希算法:就是采用user_id%的方式;
  范围:可以根据user_id字符值范围分区,如1-1000为一区,1001-2000则是另一个区等;
  映射关系:就是将user_id存在的所对应的分区放在数据库中保存,当用户操作时先去查询所在分区,再进行操作;

对于以上几种扩展方式,读写分离主要是操作上的扩展,垂直分区主要是对写入较频繁数据表的分离,水平分区主要是数据分离;

其他参考:

http://fanqiang.chinaunix.net/db/mysql/2006-05-08/4135.shtml

 

负载均衡:http://wuchengyi.javaeye.com/blog/670260

反向代理:http://baike.baidu.com/view/1165595.htm 可以用apache或者nginx作为反向代理服务器

 

此条目发表在 心情随笔 分类目录,贴了 , , 标签。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>