yuejianjun - 博客园

搜索结果点击情况进行加权

2012-07-18 23:46 by yuejianjun, 326 阅读, 0 推荐, 收藏, 编辑

摘要：在垂直列表显示的每页搜索结果中：i显示排名 P，当页点击条目数 D未点击加权：这每条加权为W(i)=(P-D)<0?(1/(D-P)):1点击加权：这每条加权为W(i)=(P-D)<0?(P-D)+1:2最后对W(i) 开根号或者log等加权到搜索权重中去阅读全文

0 Comment

java httpURL连接远程服务器并返回数据(httpurlconnection)（转）

2012-06-29 15:41 by yuejianjun, 540 阅读, 0 推荐, 收藏, 编辑

摘要：Java发送http请求 (get与 post方法请求)，以下代码经本人亲自调试可用！可以直接使用之。注意：通过BufferedReader 读取远程返回的数据时，必须设置读取编码，否则中文会乱码！package com.jiucool.www.struts.action; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.File; import java.io.FileReader; import java.io.IOException; import java.io.InputS. 阅读全文

0 Comment

实体类 topN

2012-06-26 16:22 by yuejianjun, 190 阅读, 0 推荐, 收藏, 编辑

摘要：ObjectScore[] obj = ObjectScoreArray.GetObjectScoreArray();ScoreSort.TopSort(obj, 5, new ObjectScoreComparer());obj 前5个最小using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace Test{ class ScoreSort { public static void TopSort(ObjectScore[] array, int top, O... 阅读全文

0 Comment

topN 堆排序（int 类型）

2012-06-26 15:00 by yuejianjun, 385 阅读, 0 推荐, 收藏, 编辑

摘要：using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Diagnostics;namespace Test{ class Program { static void Main(string[] args) { List<int> testValues = new List<int>(); Random rand = new Random(); int count = 100; for (int i = ... 阅读全文

0 Comment

过滤词

2012-05-10 21:02 by yuejianjun, 218 阅读, 0 推荐, 收藏, 编辑

摘要：<?xml version="1.0" encoding="GB2312"?>-<wordList> <word>,</word> <word>.</word> <word><</word> <word>></word> <word>?</word> <word>/</word> <word>\</word> <word>|</word 阅读全文

0 Comment

Lucene的评分(score)

2012-05-09 14:14 by yuejianjun, 436 阅读, 0 推荐, 收藏, 编辑

摘要：在Lucene中score简单说是由 tf * idf * boost * lengthNorm*coord(q,d)计算得出的。 tf：是查询的词在文档中出现的次数的平方根 idf：表示反转文档频率，观察了一下所有的文档都一样，所以那就没什么用处，不会起什么决定作用。Term t在几篇文档中出现过，对于一个特定的搜索词，该值是一个定值，对所有文档都一样，就不会影响打分。 boost：激励因子，可以通过setBoost方法设置，需要说明的通过field和doc都可以设置，所设置的值会同时起作用 lengthNorm：是由搜索的field的长度决定了，越长文档的分值越低。lengthNor... 阅读全文

0 Comment

位图求交集

2012-04-26 23:00 by yuejianjun, 422 阅读, 0 推荐, 收藏, 编辑

摘要：位图求交集View Codepublicclass位图求交集{///<summary>///排序数组///</summary>///<paramname="list">排序数组</param>///<paramname="MaxNumber"></param>///<returns></returns>publicstaticList<int>BitList(List<List<int>>list){intcount=lis 阅读全文

4 Comment

位运算包含功能

2012-03-21 21:14 by yuejianjun, 446 阅读, 0 推荐, 收藏, 编辑

摘要：publicclass位运算包含功能{publicstaticvoidIsContains(){intintSubClassID=0;intintClassid=0;int[]main=newint[]{3,5,7,8,9};for(inti=0;i<main.Length;i++){intClassid=1<<main[i];intSubClassID|=intClassid;}intqa=25;qa=GetBit(qa);if((intSubClassID&qa)!=qa){///不包含Console.WriteLine("不包含");}els 阅读全文

0 Comment

页面抓取匹配时，万恶的\r，\n，\t 要先替换掉为空，出现匹配有问题，都是这个引起的

2011-12-03 00:04 by yuejianjun, 337 阅读, 0 推荐, 收藏, 编辑

摘要：页面抓取匹配时，万恶的\r，\n，\t 要先替换掉为空，出现匹配有问题，都是这个引起的阅读全文

0 Comment

探索推荐引擎内部的秘密，第 1 部分: 推荐引擎初探

2011-12-01 23:34 by yuejianjun, 257 阅读, 0 推荐, 收藏, 编辑

摘要：http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html赵晨婷, 软件工程师, IBM马春娥, 软件工程师, IBM简介：随着 Web 技术的发展，使得内容的创建和分享变得越来越容易。每天都有大量的图片、博客、视频发布到网上。信息的极度爆炸使得人们找到他们需要的信息将变得越来越难。传统的搜索技术是一个相对简单的帮助人们找到信息的工具，也广泛的被人们所使用，但搜索引擎并不能完全满足用户对信息发现的需求，原因一是用户很难用恰当的关键词描述自己的需求，二是基于关键词的信息检索在很多情况下是不够的。而阅读全文

0 Comment

jianjunyue