|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
你所列的那些其实差不多都可以称为应用服务器(servlet应该说是一种语言更合适)net网页编程是开放的,相同的工具就会有很多公司在做,加上net网页编程已经发展了很多年了,因此这些工具就很多了。他们很多都是类似的。reCAPTCHAASP.NET类库供应了一个十分复杂直不雅的体例,在您的ASP.NET站点上安排一个CAPTACHA组件,以此制止网站遭到呆板人的搅扰。这个类库封装了reCAPTCHAAPI。您可使用C#或VisualBasic.NET等任何一种.NET言语来操纵这个类库。
一个CAPTCHA程序可以天生一些人类能经由过程,可是今朝的盘算机却没法经由过程的测试。比方,人类可以浏览以下图中歪曲的笔墨,可是今朝的盘算机程序却没法将其辨认出来:
<br>.reCAPTCHA中的歪曲笔墨是书本数字化历程的产品:为了使盘算性能够猎取人类常识和更好的传布信息,今朝已有多个项目正在想法将盘算机时期之前的出书物举行数字化。册页起首被扫描成照片,然后利用“OpticalCharacterRecognition”(OCR)手艺将其转化为笔墨。将图片内容转化为笔墨十分有效,由于书本扫描成图片以后将很难被保留在小型的设备中,难以下载,而且没法举行查询。不外成绩在于OCR手艺其实不完善(下图为OCR堕落示例)。reCAPTCHA将盘算机没法浏览的笔墨经由过程CAPTCHA的体例在Web页面上展示出来,由人举行辨认,并以此为书籍数字化的历程做出奉献。详细地说,就是将OCR没法准确辨认的单词以图片的体例显现并作为CAPTCHA来利用。这个做法是可行的,由于年夜部分的OCR程序在没法准确辨认单词时将给出提醒。
<br>不外,既然盘算机没法浏览此类CAPTCHA,体系又怎样晓得这个成绩的准确谜底呢?它的事情体例在于,每一个OCR没法辨认的新单词将会和另外一个已断定的单词一同供应给用户,而用户会原告知同时输出两个单词。假如谜底已知的单词被准确输出,那末体系假定新的单词也是准确的。为了进步正确率,不管输出的了局是不是准确,体系城市天生新的图片让其他一些用户再次举行识别。
今朝,我们正在匡助InternetArchive里的书本和旧版纽约时报举行数字化。 假如您要利用reCAPTCHA.NET:
- 下载Recaptcha.dll并将其放至bin目次中。
- 为您的网站猎取公钥及私钥。
- 将自界说reCAPTCHA考证控件到场页面中。
ReCAPTCHA同时还供应了一个Email地点CAPTCHA。
关于reCaptcha控件的一个常碰到的埋怨是它没有供应一个ValidationGroup属性。因而,假如网站必要到场一个较为庞大的ValidationGroup布局时,您大概必要多做一些分外的事情。
检察英文原文:ReCAPTCHAASP.NETLibrary
来自:http://www.infoq.com/cn/news/2008/10/recaptcha数据挖掘有点高深的,主要估计就是使用一些算法提取一些实用的数据。学好数据挖掘的话可以应聘baidu或者google,但是一般人家对算法的要求听高的。你最好还是学点应用型的吧。这种主要是研究型的。 |
|