算法小结

对于二分查找的bug

1）对于代码：

//当l和r都很大时，容易溢出
int mid=(l+r)/2;

解决：

//改用减法替代加法
int  mid=l+(r-l)/2;

2）可用递归或迭代的方式实现：

递归比迭代在性能上略差，但差异仅是常数级别的。

二分搜索树

二分搜索树的优势：

高效
不仅可查找数据；还可以高效地插入，删除数据 - 动态维护数据
可以方便地回答很多数据之间的关系问题： min, max, floor, ceil, rank, select

二分搜索树 Binary Search Tree概念（天然地包含了递归结构）：

二叉树
每个节点的键值大于左孩子；每个节点的键值小于右孩子；
以左右孩子为根的子树仍为二分搜索树
不一定是完全二叉树（使用数组不经济，使用节点（用指针或引用，在java中就将结点封装成类，在类中定义自身类型的左右孩子节点））

二分搜索树的遍历：

深度优先遍历：前中后序遍历
层序遍历（广度优先遍历）：要用到队列

二分搜索树的删除（最复杂的操作）：

删除最大值、最小值；
删除任意节点：删除只有左孩子或者只有右孩子的节点；删除既有左孩子又有右孩子的节点（选左孩子中最大值或者右孩子中的最小值）。
删除二分搜索树的任意一个节点时间复杂度 O(logn)

二分搜索树的顺序性：

minimum , maximum，
successor , predecessor，（对于树中存在的元素）
floor , ceil，（对于树中不存在的元素）
rank , select（元素中增加以该元素为根的树的元素个数）（难点在于怎么在insert和delete操作时维护好新增的元素个数这一数据）

二分搜索数的局限性：

同样的数据，可以对应不同的二分搜索树。二分搜索树可能退化成链表。

改进：平衡二叉树（概念）——红黑树（平衡二叉树的一种实现）

平衡二叉树和堆的结合：Treap。

其他的树形结构：

递归法——天然的树形性质

并查集 Union Find

非常高效的处理：

连接问题 Connectivity Problem。

网络中节点间的连接状态网络是个抽象的概念：用户之间形成的网络。
数学中的集合类实现

对于一组数据，主要支持两个动作：

union( p , q )
find( p ) //找它的根

用来回答一个问题

isConnected( p , q )

1）并查集的一种实现思路：

Quick Find：

Quick Find方式中，查找操作非常快，可是在“并”这个操作中操作将十分的慢。

2）另一种实现思路（常规思路：Quick Union）：

将每一个元素，看做是一个节点。在节点上建立连接关系，使当前节点指向其父结点。

使得并和查操作更快：

并：合并时，查到要合并的两个元素的根，让两个根连接在一起；

查：查找两个节点是否连接时，只需要查找到其根结点即可。

优化（针对Union操作）：

1）基于size的优化。

size数组表示根节点为i的树的元素数量。

每次合并的标准为size数组的大小。

确定一下每个集合的大小，使得每次合并时都是数量小的那组根结点连接到数量多的那组根结点上，以减少树的层数。

2）基于rank的优化

在并查集中采用rank的数组来表示树的层数（树的高度）。

rank[i] 表示根节点为i的树的高度。

每次合并的标准为rank数组的大小。

对于要把4和2连接起来。

结果是这样呢：（树的层数为4）

还是这样：（树的层数为3）

在该优化代码中，当一个小层次的树连接到一个高层次的树时，不需要维护rank数组，而是在两个数的高度相等时连接需要维护一下rank数组，即将被连接的树的根节点的rank中对应元素值加一。

3）另一种优化方式（针对find操作）：路径压缩 Path Compression

理论上，在并查集中每个父节点可以连接无数个孩子节点（一层），路径压缩就是在find操作的过程中跳了两步。（本来是跳一步）

（以下图第一个节点find操作为例）

在查找某个节点的根结点时，（当前考察对象为节点4）若查到当前节点的父结点和当前节点不一样，即当前节点不是根结点，那么就压缩一步，把这个节点的位置往上挪一个（也就是让它去连接它父亲的父亲）；

此时，当前节点（节点4）连接到了它原来父亲节点的父亲节点（即节点2），考察此当前节点（节点4）的当前父亲节点（节点2）是不是根节点（即考察它的父亲节点是不是自身），（当前考察对象转变为节点2，即原来节点“路径压缩”后的父节点）若不是，则再次进行路径压缩，让该节点的父结点去连接它父结点的父结点，然后再次进行考察对象转移。

实现路径压缩。