由一个简单算法想到的程序员素养问题

  题记:五月从帝都回到武汉,旅游半个月后开始找新工作,六月选择了一家华中地区为数不多的移动互联网公司入职至今,略有感触——比较帝都码农与武汉码农的平均水平,就跟两个城市的经济发展水平差异一样大,不是说武汉这边没有优秀的程序员(我也算半个嘛),而是说平均水平确实不如其他一线城市。想想也正常,巨头公司都扎堆北上广深,以极具竞争力的薪酬福利和巨头光环吸引着广大程序员,反观武汉的互联网发展尚处在初级阶段,无论从公司规模、名气还是最实际的薪酬福利方面均不如一线城市,自然无法吸引广大程序员咯。本人在新公司待了近三个月,慢慢发现代码中的一些问题,而这些问题中除开因为个人能力短时间无法解决的,剩下的就是我想探讨的程序员素养问题。

  先说下我所认为的程序员素养吧,我认为应包括以下几个方面呢:1,扎实的功底——扎实掌握操作系统,数据结构等大学基本课程,鼓吹基础无用论的,必定是个三流程序员。2,学习心态——对你所调用的,一定要有好奇心,尽可能花时间去了解API背后的东西,去了解系统框架是如何运作;对新的领域,一定要有好奇心,多尝试多学习,他山之石,可以攻玉。3,善于自学、总结、发问——工作后没有人去手把手教你,只要自己刻苦专研,并总结成博客或者笔记之类的成果,才又提高;在遇到自己能力范围内解决不了的问题,要善于向牛人请求点播,而一针见血的问题往往也会收获一针见血的回答。

  举一个简单的例子来讨论素养1,需求如下:已经完成排序的1万条数据,现在需要取前5000条作为最终数据,考虑到数据量较大,如果是新建列表,遍历旧列表的5000条并重新建立引用,有(引用类型所占字节 * 5000)字节的空间上的浪费,而且这种方式显得比较笨拙。

  所以,略加思索后写出了以下代码:

List<Item> rankItems = new ArrayList<Item>();
// 生成数据+排序
...
while (rankItems.size() > 5000) {
    rankItems.remove(rankItems.size() - 1);
}

  简单分析,对于ArrayList大家都不陌生,是以数组方式实现的链表,remove(index)方法实质上调用的是System.arraycopy()方法,源码如下:

    /**
     * Removes the object at the specified location from this list.
     *
     * @param index
     *            the index of the object to remove.
     * @return the removed object.
     * @throws IndexOutOfBoundsException
     *             when {@code location < 0 || >= size()}
     */
    @Override public E remove(int index) {
        Object[] a = array;
        int s = size;
        if (index >= s) {
            throwIndexOutOfBoundsException(index, s);
        }
        @SuppressWarnings("unchecked") E result = (E) a[index];
        System.arraycopy(a, index + 1, a, index, --s - index);
        a[s] = null;  // Prevent memory leak
        size = s;
        modCount++;
        return result;
    }

  System.arraycopy()是native方法,调用的应该是C语言中的memcpy(),虽然copy的source地址和dest地址都是相同的,无需分配新内存,但是要经过5000次的内存IO读写才能删除ArrayList中的数据。究其原因是因为ArrayList的数组实现方式,不利于在指定位置做添加/删除操作,所以思考后有了以下代码:

List<Item> rankItems = new LinkedList<Item>();
// 生成数据+排序
...
while (rankItems.size() > 5000) {
    rankItems.remove(rankItems.size() - 1);
}

  再分析LinkedList的删除效率,是否比ArrayList高了呢?LinkedList的remove(index)方法实现如下:

/**
     * Removes the object at the specified location from this {@code LinkedList}.
     *
     * @param location
     *            the index of the object to remove
     * @return the removed object
     * @throws IndexOutOfBoundsException
     *             if {@code location < 0 || >= size()}
     */
    @Override
    public E remove(int location) {
        if (0 <= location && location < size) {
            Link<E> link = voidLink;
            if (location < (size / 2)) {
                for (int i = 0; i <= location; i++) {
                    link = link.next;
                }
            } else {
                for (int i = size; i > location; i--) {
                    link = link.previous;
                }
            }
            Link<E> previous = link.previous;
            Link<E> next = link.next;
            previous.next = next;
            next.previous = previous;
            size--;
            modCount++;
            return link.data;
        }
        throw new IndexOutOfBoundsException();
    }

  LinkedList的删除操作很简单,只需要修改指定index对象其前后对象的引用即可,但是在指针移动到指定index之前,需要移动1/2个列表长度,效率并非最高,能否将移动的操作也简化掉呢?既然是已排好序的列表,每次删除都删除列表末尾的对象,那我们可以使用LinkedList提供的removeLast()方法,代码如下:

List<Item> rankItems = new LinkedList<Item>();
// 生成数据+排序
...
while (rankItems.size() > 5000) {
    rankItems.removeLast();
}

  分析removeLast()的效率,LinkedList的removeLast()方法实现如下:

/**
     * Removes the last object from this {@code LinkedList}.
     *
     * @return the removed object.
     * @throws NoSuchElementException
     *             if this {@code LinkedList} is empty.
     */
    public E removeLast() {
        Link<E> last = voidLink.previous;
        if (last != voidLink) {
            Link<E> previous = last.previous;
            voidLink.previous = previous;
            previous.next = voidLink;
            size--;
            modCount++;
            return last.data;
        }
        throw new NoSuchElementException();
    }

  LinkedList的removeLast()方法没有移动指针的操作,只需要借助于列表尾的voidLink,即可完成对列表尾部对象的删除,效率上较高。

 

  公司的大牛review了相关代码,提议使用AbstractList的subList(start, end)方法直接范围所需数据,我看了下源码,subList()相当于在不修改数据源的情况下,设定start, end并Override相关方法及Iterator,形成了原列表的一个“视图”,将原列表的可见范围限定[start, end)的区间内。总结一下,如果接下来的代码只是使用列表中的部分数据,而剩下数据又不是很占用内存的情况下,确实用subList(start, end)更好,连指针操作都省去了~

 

结束语:一个程序员一定要对自己的代码负责到底,优化,不仅对业务有所提升,更多的是在思考优化的过程中对提升自己的功力很有帮助。最近闲时时常思考自己的职业规划与出路,迷茫之中终有坚定,坚持做一个好的程序员,一定会有美好的明天!

posted @ 2014-09-15 18:26  热气球  阅读(2823)  评论(12编辑  收藏  举报