网站cache机制

在网站开发中，cache机制是一个非常好用的性能提升方法。其实在其他领域，cache也有着广泛的应用。我在这里整理一下自己在网站开发中使用cache的思路。

首先，网站的通讯模型并不复杂，所有的操作都是用户发起一个请求，然后服务器端回应请求返回数据。中间经过了很多的层级，按照用户端到服务器端的距离，可以分为：

同时，我们可以发现一些特性和规律：

我们可以根据这些特性，利用cache机制来优化整体访问延迟时间，以及优化服务器性能。

方法和注意点

针对每个请求，越在上层返回，请求处理消耗的时间越少。所以如果要尽量提升性能，就要尽量短接请求。我们可以用cache，预测结果，拆分请求的方式来减少反应时间。

cache：如果下面层级的数据没有更新，可以缓存这部分的数据，下次请求进来的时候返回，消除下层操作的时间成本和性能消耗。
预测结果：针对结果确定的请求，可以先返回结果，后进行操作。比如浏览器端用户点击关注按钮，可以先更新页面，然后ajax发起请求；服务器端直接返回成功的结果，后台异步再进行处理。
拆分请求：如果一个请求有多步操作，那么可以先返回快的操作，然后再返回慢的操作。比如先返回外框页面，通过ajax获得内部耗时区块信息；或者服务端多线程渲染不同的区块，最后合并返回给用户。

针对不同层级的cache短接方法：

用户端：用js缓存数据，用户点击的时候，渲染对应的区块。
http：如果用户已经请求过这个页面，而这个页面也没有更改过，可以利用http的cache机制只返回http头，基本不消耗服务器资源以及砍掉服务器准备数据和渲染时间。
页面渲染：如果页面其中一个区块的数据没有变更，直接返回上次渲染的页面。
数据model和数据库查询：同上，数据没有变更，就可以返回上次生成的对象。

在进行cache设计的时候，我们需要平衡好开发成本，系统复杂度，性能，以及资源消耗，要对做的事情，带来什么样的后果和收益心中有数，针对不同的策略进行权衡。

页面渲染：如果一个页面包含有静态的部分和动态的部分，可以把他们拆分开来，缓存静态的部分，节省这部分的渲染时间。但是如果这两块页面混杂起来，需要花费一些心思，比如用js来动态合并。由此给前端带来一定的复杂度。这部分的复杂度会带来更多的bug，更高的测试成本，以及未来改动更加困难。
caceh机制需要考虑过期的方式。如何应对嵌套cache？如果cache内部是根据多个对象渲染的，是基于推还是基于拉的方式让cache过期？rails在这方面有比较成熟的解决方案。

如果cache的数据维度过多，会造成cache爆炸。比如说页面需要根据语言，用户，国家等来生成，各维护一个版本的cache的话就有点多了，需要想办法降低维度：

同时也要考虑这些手段带来的复杂度是否能够把控。

2/8原理：在消耗资源多的地方使力。比如在网站首页，列表的前几页等经常访问到的页面花大功夫，而不要太花时间去优化很少被访问到的地方。

csdn robbin针对ORM cache优化非常有心得，可以学习一下。

cache的实现方式，可以用文件，内存，或者单独的cache服务器。如果服务端采用多个进程来服务，最好采用一个cache服务器，这样不会出现每个进程各自维护一份同样内容cache的状况。