Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 6|回復: 0

果机器只能看到文档中

[複製鏈接]

2

主題

2

帖子

8

積分

二次元新人

Rank: 1

積分
8
發表於 2024-2-18 14:58:08 | 顯示全部樓層 |閱讀模式
白纸测试是关于没有上下文的清晰度。 但是如果我们在机器而不是人上执行 会怎样呢?我们的思想实验仍然适用吗?我想是这样。机器无法阅读 即使是像谷歌和必应这样复杂的机器也是如此。他们只能猜测我们内容的含义这使得测试特别有意义。 我有 的替代版本但对于机器来说如出现的单词列表以及出现频率它是否可以合理地猜测文档的内容? 空白纸测试词频 如果你递给某人一张白纸上面唯一写的就是这张单词和频率。

表他们能猜出这篇文章是关于什么的吗? 一篇关于磨刀的文章是一个很好的猜测。我从这篇文章中获取了这个词频表 易趣编号数据 这是一本磨刀菜刀的指南。 如果表中出现 步骤 和 如何 这两个词怎么办?阅读这篇文章的人会对磨刀更有信心还是更少?他们能分辨出这篇文章是关于磨菜刀还是小刀吗? 如果我们不能根据文章使用的单词来很好地了解文章的内容那么它就无法通过 的词频测试。 我们还可以使用 的词频吗? 搜索引擎早期。



采用的自然语言处理方法使用词频和词共现的统计分析来确定页面的内容。他们忽略了我们内容中单词的顺序和词性基本上将我们的页面视为单词袋。 我们用于优化此类 的工具将我们的内容的词频与竞争对手进行比较并告诉我们词语使用的差距在哪里。假设如果我们将这些词添加到我们的内容中我们的排名会更高或者至少可以帮助搜索引擎更好地理解我们的内容。 这些工具仍然存在 、 、 、 等具有某种词频或 差距分析功能。
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|二次元奇缘

GMT+8, 2025-2-3 21:55 , Processed in 0.062188 second(s), 20 queries .

抗攻擊 by GameHost X3.4

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |