GitHub - Natural Language Semantic Code Search

查看原文

本文介绍了 GitHub 工程团队的一个脑洞 - 使用自然语言搜索代码:https://experiments.github.com/semantic-code-search

目前它还只能搜索一些简单的 Python 相关的函数和方法。底层原理是

  • 搜索的词经过 Text Encoder 算出一个向量, 基于 fast.ai 库封装。
  • 仓库里的代码经过 Code Encoder 也算出一个向量, 使用了 sequence-to-sequence model / tree-based LSTMs / gated-graph networks 等算法。
  • 比较向量的相关性,给出列表。