• 淘宝搜索算法现状

    淘宝搜索排序的目的是帮助用户快速的找到需要的商品。从技术上来说,就是在用户输入关键词匹配到的商品中,把最符合用户需求的商品排到第一位,其它的依次排在后续相应的位置。为了更好的实现这个目标,算法排序系统基本按三个方面来推进: 一、算法模型 当用户输入关键词进行搜索的时候,系统依据算法模型来给匹配到的每个商品进行实时的计算,并按照分数的大小对商品进行排序。 对于好的算法模型,首先需要考虑我们能够有哪些特征因子可以应用。比如在网页搜索中,算法模型基本就是按网页的重要性和相关性给网页计算一个分数,然后……
  • code123
    10个基础实用算法及其讲解

    10个基础实用算法及其讲解

    算法一:快速排序算法 快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需……
  • code123
    OAuth 认证流程详解

    OAuth 认证流程详解

    很多网站、APP 弱化甚至没有搭建自己的账号体系,而是直接使用社会化登录的方式,这样不仅免去了用户注册账号的麻烦、还可以获取用户的好……
  • code123
    字符串匹配算法(2) KMP算法

    字符串匹配算法(2) KMP算法

    字符串匹配 是计算机的基本任务之一。 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD……
  • code123
    字符串匹配算法(1) Boyer-Moore算法

    字符串匹配算法(1) Boyer-Moore算法

    上一篇文章,我介绍了 KMP算法 。 但是,它并不是效率最高的算法,实际采用并不多。各种文本编辑器的"查找"功能(Ctrl+F),大多采用 B……
  • code123
    程序员面试中常见10大算法汇总

    程序员面试中常见10大算法汇总

    以下是在编程面试中排名前10的算法相关的概念,我会通过一些简单的例子来阐述这些概念。由于完全掌握这些概念需要更多的努力,因此这份列……
  • code123
    TF-IDF与余弦相似性的应用3:自动摘要

    TF-IDF与余弦相似性的应用3:自动摘要

    有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章……
  • code123
    TF-IDF与余弦相似性的应用2:找出相似文章

    TF-IDF与余弦相似性的应用2:找出相似文章

    上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似……
  • code123
    TF-IDF与余弦相似性的应用1:自动提取关键词

    TF-IDF与余弦相似性的应用1:自动提取关键词

    这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。 有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase ext……
  • code123
    相似图片搜索的原理(二)

    相似图片搜索的原理(二)

    二年前,我写了 《相似图片搜索的原理》 ,介绍了一种最简单的实现方法。 昨天,我在 isnowfy 的网站看到,还有其他两种方法也很简单,……
  • code123
    相似图片搜索的原理(一)

    相似图片搜索的原理(一)

    上个月,Google把 "相似图片搜索" 正式放上了首页。 你可以用一张图片,搜索互联网上所有与它相似的图片。点击 搜索框 中照相机的图标……
  • code123
    一些酷炫的代码片段

    一些酷炫的代码片段

    看了下面这些代码,不得不佩服程序员的智慧。只有想不到,没有做不到。 题目:用三段 140 字符以内的代码生成一张 1024×1024 的图片  原……
  • code123
    一个故事告诉你比特币的原理及运作机制

    一个故事告诉你比特币的原理及运作机制

    一篇关于比特币的有意思的文章,分享给大家! 周末花时间看了一些比特币原理相关的资料,虽然不敢说把每个细节都完全搞懂了,不过整体思……
  • code123
    比特币(Bitcoin)系统是如何运行的?

    比特币(Bitcoin)系统是如何运行的?

    深入浅出比特币 作者地址:136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr 在不删除作者地址,不删改原文的前提下,本文可在任何形式媒体上自由转载……