和山论坛

 找回密码
 会员注册
查看: 1286|回复: 7
打印 上一主题 下一主题

关于IMDB

[复制链接]
跳转到指定楼层
楼主
发表于 2006-8-13 13:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
相信经常在各大BT网站下载电影的网友对这不会陌生吧,这是互联网最大的“电影数据库”,或许有些人会对她不屑,不过还是有必要了解一下
下面是转自其他网站的资料贴
什么是IMDB
因特网电影数据库(IMDB,既InternetMovieDataBase)创建于1990年,IMDB是目前全球互联网中最大的一个电影资料库,里面包括了几乎所有的电影,以及1982年以后的电视剧集。
IMDB连接就是由IMDB网站所提供的电影、电视剧连接地址
沙发
 楼主| 发表于 2006-8-13 13:03 | 只看该作者
IMDB是目前全球互联网中最大的一个电影资料库,里面包括了几乎所有的电影,以及1982
年以后的电视剧集。IMDB的资料中包括了影片的众多信息,演员,片长,内容介绍,分级
,评论等,就个人买碟而言,很大程度上也是参考IMDB的得分。
而IMDB的得分又是如何来的呢?它的可靠性又有多少呢?让我们通过《魔戒1:护戒使者》
来做具体分析吧,先看上图:
这张图就是魔戒1的所有评分者的分数的一个条状统计图。
从中我们可以看到各个分数段的大致比例,比如这儿就可以发现,超过一半的人是打满分
的。
根据IMDB网站上公布的TOP250评分标准:
imdb top 250用的是贝叶斯统计的算法得出的加权分(Weighted Rank-WR),公式如下:
weighted rank (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C
其中:
R = average for the movie (mean) = (Rating)
(是用普通的方法计算出的平均分)
v = number of votes for the movie = (votes)
(投票人数,需要注意的是,只有经常投票者才会被计算在内,这个下面详细解释)
m = minimum votes required to be listed in the top 250 (currently 1250)
(进入imdb top 250需要的最小票数,只有三两个人投票的电影就算得满分也没用的)
C = the mean vote across the whole report (currently 6.9)
(目前所有电影的平均得分)
另外重点来了,根据这个注释:
note: for this top 250, only votes from regular voters are considered.
只有‘regular voters‘的投票才会被计算在IMDB top 250之内,这就是IMDB防御因为某
种电影的fans拉票而影响 top 250结果,把top 250尽量限制在资深影迷投票范围内的主要
方法。regular voter的标准不详,估计至少是“投票电影超过xxx 部以上”这样的水平,
搞不好还会加上投票的时间分布,为支持自己的心爱电影一天内给N百部电影投票估计也不
行。
因此,细心的人可以注意到,列入IMDB top 250的电影,其主页面上的分数与250列表中的
分数是不同的。
以魔戒1为例,它在自己的页面http://www.imdb.com/title/tt0120737/中的分数是8.8,
而列表中是8.7。一般 250表中的得分都会低于自己页面中的得分,越是娱乐片差距越大。
这大概是因为regular voter对于电影的要求通常较高的关系

[ 本帖最后由 datougua 于 2006-8-14 06:14 PM 编辑 ]
板凳
 楼主| 发表于 2006-8-13 13:03 | 只看该作者
下面是IMDB历史的介绍
IMDb编年史  
                             创世纪

  开始的开始,是文本。

  早期互联网的有限用户只能通过Email或Usenet(世界性的新闻组网络系统)彼此交换信息,他们来自互联网下的各类局域网,在公告牌和讨论版上展开热火朝天的讨论。

  这其中一个叫rec.arts.movies的新闻组,渐渐汇集了一批探讨电影并分享信息的影迷,出于共同的话题需要,他们创建了FAQ's (常见问题表,Frequently Asked Questions lists),下设四个单元:男演员,女演员,导演,以及专门为已故影人设立的小传(俗称“死亡名单”"the 'dead' list")。到了1990年10月,这几个单元组收录的信息条目已超过23000个,覆盖了将近一万部电影及电视剧集。

  天地之初一片混屯,于是组织创始人/现任常务董事科尔·尼达姆(Col Needham)说:“要有检索性”,于是便有了搜索引擎——但可想而知,太古时代的搜索引擎将是多么原始:科尔·尼达姆张贴了一份Unix系统下的命令解释程序〔壳体〕程序,用户可以借此使用命令语言发出搜索请求,并得到有意义的结果。以上提及的四组资源列表及其查询程序便组成了“IMDB前传”——纯文本Unix版,时称“rec.arts.movies电影数据库”(rec.arts.movies movie database)。

  数据库的基本目标过去是现在仍是“为互联网上尽可能多的平台用户提供有用且免费的电影时效信息”("provide useful and up to date movie information freely available online across as many platforms as possible.")。在当时,所谓尽可能多的用户平台,其实主要是指Unix系统。后来,在志愿者的努力下,才终于创建了服务于DOS,OS/2甚至Amiga不同版本。

  请记住,这是1990年。在那样一个蛮荒的年代,Windows操作系统还在襁褓之中,鼠标“点击”这一近乎“本能”的动作还要过几年才诞生,而第一版公众“浏览器”也尚未问世。那时,登陆互联网的绝大部分用户都要靠雇主或大学等机构提供Unix壳体程序的账号,他们知道怎样输入计算机命令语言,知道怎样编写计算机壳体程序——对他们来说,这并非难事。

    这些初始程序给早期的用户们带来了无穷乐趣,愈快乐愈勤奋,他们接着建立了更多的分类目录和信息,包括编剧,作曲和摄影。然后就是投票系统,用来记录并统计用户们给每部电影从1到10的评分。



                            革命

  尽管在90年到93年之间,软件系统不断更新,IMDB的七个分类目录仍然保持着相对稳定。1993年,IMDB搜集和呈现信息的方法获得了巨变,内容的深度也同时得到了提高。

    在剧组(movie cast)栏目中加入了角色的姓名,辅以八卦(trivia)(其下又加入疯狂字幕crazy credits),小传(biographies),剧情摘要(plot summaries)。更重要的是在日益“集权化”的数据库中添加了自动化的Email界面,这样,用户们就可以不必在自己的单机系统上运行IMDB的副本,直接用电子邮件发送搜索请求并得到信件回复。这一界面至今已有八年历史,仍在运行。

  就在Email服务器推出之时,电影数据库的扇子们开始了创建万维网(web)版本的大胆构想,那时,互联网上第一个图形化万维网浏览器,NCSA的马赛克(Mosaic)甚至还处在beta版测试阶段。现在看来,这一构想绝对具有高瞻远瞩的战略意义,但它的缔造者们却没有从商业角度考虑,他们大多是朝气蓬勃的大学生和程序员,迫不及待的要在充满机遇与挑战的网络世纪大展身手。

  终于,电影数据库的第一个web版本在位于威尔士的加蒂夫大学(Cardiff University)成功运行,它的界面创始人Rob Hartill和Col Needham为每天100次接入的惊人流量兴奋不已。随后,经过不断修改,IMDB拥有了每月来自350万来访者高达6500万次的接入纪录。

  1994年4月,IMDB又向前迈进了一步:集中管理各类目下用户提交的更新信息。在此之前,人们要提交信息必须先找到拥有该类目的作者的Email地址,然后再寄给相关管理员。一旦把这一系统集权化,所有的信息就可以全部提交到同一个地方。

[ 本帖最后由 datougua 于 2006-8-14 06:17 PM 编辑 ]
地板
 楼主| 发表于 2006-8-13 13:03 | 只看该作者
合并

  随着网站的日趋庞大,加蒂夫大学的一部服务器也渐渐不堪重负,1995年初,遍布世界各地的IMDB镜像网站开始运行,Email系统得到进一步完善,信息量成几何级数般增长,单周内流入的信息就超过1990年底整个数据库的容量。同年,每月一发的新闻邮件服务也开始投入使用。

  更重要的是,尽管当时该网站仍然植根于rec.arts.movies新闻组,但实际上其操作层面已经遍布互联网各级,可谓无孔不入,为反映这发展,站点的名字随即改为“互联网电影数据库”(Internet Movie Database,即今天的IMDB)。同时,站内迅速繁殖的数据信息开始超出资助者所能提供的设备及带宽能力,也大大超出了志愿者们管理这些信息所能支出的时间和金钱。

  离开Usenet之后,关于IMDB发展方向的争论渐趋激烈,一方面要秉承信息共享这一免费原则,另一方面又要继续供养网站的生存,与其他商业项目竞争,控制自己的命运。很明显,IMDB必须走商业化的道路。于是在95年底96年初,IMDB注册成为有限公司。

    但与其他IT企业不同,IMDB并没有选择入住硅谷,也没有试图引入动辄数百万美元的风险投资,它的股东们仍然是当初那些一手缔造IMDB的“原始天尊”,他们主要通过广告,许可,合股等方式争取收入来源,而且除了少数几位负责管理运作的全职杀手之外,其他员工都是兼职,白天有自己的工作,只是到了晚上或周末才进入状态。

  稍后,IMDB关掉了其他地区空间及带宽均有限的镜像站点,分别在美国和英国设立了更加专业的分站。出乎他们意料的是,走上商业化道路之后,当初他们预计的反商业后坐力并没有席卷而来,用户的抱怨微乎其微。毕竟,更正规的运作意味着更好的服务。不到一年之后,IMDB就在美国有了9部服务器。当然,这个能力很快就跟不上发展势头了。



                            亚玛逊(Amazon.com)

  1997年,IMDB全年提交的信息量达到1990年10月初运行时的100倍,相当于在95年之后翻了两番。来自广告/许可/合股的收入来源越来越显得杯水车薪,IMDB急需一股强大的资金流注入以减轻操劳过渡近乎义务工作的股东负担。

  当时曾经一度盛传IMDB将被大企业收购,但谣言每次都不功自破。IMDB的管理者们担心,一旦被大鱼吞掉,那些大老板们就会把现有信息标上明码实价,当初立志要免费服务来访者的伟大信条就会随之破灭。

  然后,杰夫·贝索斯(Jeff Bezos)出现了。

  这是一个跟IMDB的同志们臭味相同的CEO,他深刻的理解网络/社区理念,而不只是盯着期间蕴含的市场潜力。于是,当亚玛逊(amazon.com)的人主动联系IMDB时,他们愿意耐心的听——他们听到了不可思议的声音:“我们要你们继续做现在做的事”。

  当然,amazon.com不是横空出世的救世主,更不会白白烧钱。他们的计划是,利用IMDB庞大的信息资源帮助自己销售录像带,DVD等音像制品。IMDB有海量数据库,有业内专家,有才华过人的股东和员工,更有上百万的潜在客户。于是双方达成协议,IMDB成为amazon.com的子公司,多年付出的心血终于没有白费。

  原有的IMDB核心成员仍然留任,当初夜以继日做“兼职”的同志们也终于可以回到IMDB领新水做全职。慢慢的,公司雇佣了更多的员工,协助管理数据,解放了相当一批功夫过硬的程序员做进一步的研发工作。

  进入1998年,IMDB改头换面,数据不变,组织/呈现数据的方式却旧貌换新颜,编辑的特色得以显现,诸如首页的“今日影片”(Movie of the Day),每天发布的新闻邮件,以及每天一推的电影语录,名人生日,八卦精选/问答等等。

  历经风雨,IMDB始终没有放弃初衷,不仅要做最好的,而且要同时为死硬派影迷和业余影迷提供最好用的服务。他们升级扩展了1999年5月始建的BBS,设计了更方便快捷的浏览导航,首页加入更多趣味信息,改进搜索引擎,建立了简单易用的在线帮助系统——IMDB大学(IMDb University)。




                            未来

  2001年末,功能更强大,内容更丰富,界面更精美的IMDB增强版(IMDB PRO)正式推出,这一增强版采取收费制,包月12.95美元,全年99美元,内容专门针对电影届从业人士,尤其增强了信息统计和多重检索功能,可谓业内人士不得不用的工作利器。

  遥想当年,IMDB的创始人们从没想过要建立一个“产业”,他们只是追随自己的梦想——一群影迷彼此分享快乐的朴素愿望。十年一晃,来自世界各地数百万的影迷加入了这一行列,成为梦想的一部分。

  “做自己想做的”,这就是IMDB的真谛。

介绍到01年

[ 本帖最后由 datougua 于 2006-8-14 06:19 PM 编辑 ]
5
 楼主| 发表于 2006-8-13 13:05 | 只看该作者
值得注意的是,IMDB本身就是一个美国人开办的英文网站,所以参与IMDB的TOP250评选投票的用户在半数以上都是美国人,其中非英语国家的用户仅占少数。而众所周知的是,大部分美国人只关心自己国家的电影,很少去接触一些好莱坞以外的东西,这也就是榜单缺少欧洲、亚洲及其他地区电影的主要原因。
  所以即使香港的电影即使有的话,投票也很少,缺乏客观性

[ 本帖最后由 datougua 于 2006-8-14 06:25 PM 编辑 ]
6
 楼主| 发表于 2006-8-13 13:05 | 只看该作者
预留贴
7
 楼主| 发表于 2006-8-13 13:06 | 只看该作者
预留贴
8
 楼主| 发表于 2006-8-13 13:06 | 只看该作者
预留贴
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则


浙江科技学院和山论坛|手机客户端|小黑屋|和山论坛

GMT+8, 2025-7-15 09:36 , Processed in 0.103250 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.2

© 2005-2019 和山论坛(www.hsbbs.com)

快速回复 返回顶部 返回列表