simhash.NewWordFeatureSet() 函数类型是byte[], 对于像中文的应该用rune[]类型
simhash.NewWordFeatureSet() 函数类型是byte[], 对于像中文的应该用rune[]类型