奧斯卡誘餌是真的嗎?我們使用磚和IMDb找出數據
如果我們還不清楚100年的恐怖電影分析在磚…我們真的愛電影。我們也沉迷於數據。因此,第94屆奧斯卡頒獎典禮的右拐角處,我們認為這是最完美的時間再一次嫁給這兩個。我們選擇的主題嗎?奧斯卡誘餌,一個術語,用來描述電影似乎旨在獲得奧斯卡獎提名。
更具體地說,我們想知道:是奧斯卡誘餌真實的嗎?
這篇文章將顯示我們的方法來回答這個問題三角洲生活表(DLT)和磚的SQL處理和分析從IMDb一組豐富的數據,世界上最受歡迎的和權威的信息來源電影、電視節目和名人。除了發現一些有趣的發現(我們將分享),這個用例演示了如何DLT的聲明性方法大大減少了所需的工作和代碼管理可靠的數據管道。
奧斯卡誘餌是什麼?
在其核心,奧斯卡誘餌描述電影的意圖似乎創造了獲得奧斯卡獎提名。雖然沒有官方的定義什麼是“奧斯卡誘餌,”有一個普遍公認的主題和特點,包括:
- 屬於曆史/期或悲劇亞流派
- 長期以來,運行時
- 在發布“奧斯卡季”,過去的幾個月裏
這些特征,而需要一些解釋,成為屬性的基礎我們用來確定電影奧斯卡誘餌,最終,這些是否真的與奧斯卡獎提名或贏。
我們的數據與標準
對於我們的分析,我們使用許可IMDb奧斯卡題名電影,贏得》數據集的電影從1980年至2019年。我們選擇這個時間段比較電影在同一現代語境;例如,它不是類似於比較的特點,如運行時,一個1929年的電影《2019年的電影。注意,2020年和2021年異常年奧斯卡獎給大流行所以我們切斷了我們的分析,享年2019歲。
下一步是定義在我們的數據集的屬性構成奧斯卡誘餌。我們確認以下:
- 影片長度:> 90分鍾
- 發布幾個月:10月,11月,12月
- 子分類屬於奧斯卡誘餌(見下文)
- 不是一個動畫或紀錄片
IMDb子分類的數據集包括大量的標簽,從非常廣泛的非常具體。縮小範圍,為我們的分析,我們確定了相關關鍵字等時期,曆史,悲劇,情節,文獻片和史詩。我們選擇最常見的20個分支,最好與奧斯卡誘餌標準保持一致。杜拉拉,包括動畫和幻想被排除在外,因為這些不被認為是“奧斯卡誘餌”,但可以被附加到誘餌杜拉拉,像史詩。
建設我們的數據管道
去年,我們宣布啟動三角洲生活表一個框架,可以輕鬆地構建和管理數據處理管道。
DLT幫助數據工程團隊簡化ETL開發和管理聲明式管道的發展,自動數據測試,以防止數據質量問題,深可見性監測和恢複。這個聲明式方法意味著數據工程師隻是告訴DLT他們想要做的事- - - DLT照顧休息。用例可以隻有幾行代碼執行。
這裏的代碼片段看起來像這個用例:
然後我們使用Databrick SQL (DB SQL)來構建可視化。DB SQL有噸的性能優化,使分析師更容易構建儀表盤——所有在Lakehouse平台在一個統一的平台。Beplay体育安卓版本您可以了解更多關於磚SQL和它的好處我們之前的博客。
我們的分析
我們一起把多個儀表盤獲得洞察奧斯卡的趨勢。而我們的分析集中在表麵上的趨勢,我們確實發現了一些有趣的見解。
上麵的圖表顯示的百分比奧斯卡獎提名(上)和獲獎者(底部),滿足所有奧斯卡誘餌標準。這些顯而易見的奧斯卡誘餌始終占一小部分在幾十年的電影。敘事變得更有趣,當我們看奧斯卡獎贏了;有超過奧斯卡誘餌在2010年代增長了140%。但是開車這是什麼?
在接下來的幾節中,我們解釋什麼似乎是推動這種變化一般電影的趨勢,包括長期運行時和年終電影版本的日益流行,文獻片和黑暗,更複雜的電影。
我們的假設
當然有例外,但是奧斯卡金像獎普遍認識到電影受歡迎的公眾。這個IMDb列表甚至顯示,100%的最佳Picture-winning電影觀眾從1980年到2019年7.0或更高的分數。但就像任何其他消費產品,電影的時尚。
例如,90年代和2000年代早期被認為是愛情的“黃金時代”。但工作室有大幅減少生產的浪漫喜劇片年輕,這通常不產生共鳴,全球觀眾(盡管當然有例外)。達到今天的廣大觀眾,rom-com-drama流派所取代,這涉及到嚴肅的話題和社會評論,見曙光的劇本,藝術家和她(所有獲得奧斯卡提名)。
雖然雞肉或雞蛋的情況下,現代全球觀眾似乎通常更喜歡黑暗,更複雜的電影,其中很多屬於標準的“誘餌”比喻。
潛水深
我們的下一個分析看著三個屬性(運行時,杜拉拉和發布日期)。這些分析都是奧斯卡獎提名捕捉見解從更廣泛的電影。
洞察# 1:增加運行時
我們看第一個特征就是運行時。上麵的圖表顯示,大多數電影在幾十年運行90分鍾到2.5小時。然而,奧斯卡提名越來越長在1990年代,在2000年代幾乎增加了45%在2.5 - 3小時電影。有趣的是,《泰坦尼克號》,1997年發布的記錄在3小時14分鍾,打破了現代奧斯卡獎記錄和帶回來的不僅有開創性的11勝。有可能這啟發更多epic-length戲劇與模仿泰坦尼克號的奧斯卡成功的希望。
2000年代也標誌著epic-fantasy電影的激增(可能受CGI進步),包括《阿凡達》和指環王,《霍比特人》和哈利波特係列。這些電影通常有非常長的運行時和許多獲得奧斯卡提名並獲勝。
洞察# 2:奧斯卡季是真實的
人人都在談論“奧斯卡季”——即Oscar-worthy電影在今年年底發布他們的提名期間。圖表顯示,年終一直是最活躍的奧斯卡提名電影版本,但在2010年代的增長顯著。
這種轉變也符合流媒體服務的崛起在2000年代中期,帶來了新的競爭,電影院已經麵臨出勤率下降。今年年底也一個相當電影院由於假日休息,等。- 12月24日至1月1占近5%的年總票房收入2019。流媒體服務的額外壓力,它是有意義的電影,為了增加收入,將推出在消費者的最佳觀影時間——這也符合奧斯卡的季節。
洞察# 3:文獻片的崛起
最後,我們看看杜拉拉的變化。注意,上麵的圖表隻顯示學院被大獎提名的電影屬於誘餌杜拉拉。
正如你所看到的,在過去的10年裏,電影中有顯著的增加曆史和剪掉杜拉拉。同時,電影下降時期。
當看奧斯卡提名在過去十年中,許多“曆史”的電影不太關注“服裝或時期”戲劇,而是強調曆史時刻,現代觀眾更直接相關。我們看到的第一個《社交網絡》時(2010),社交媒體已經成為我們生活不可分割的一部分;模仿遊戲覆蓋一個老話題,說到當前技術的崛起。奧斯卡獎等狼的華爾街仍然和最大的短說最近在美國經濟衰退和討論財富。
這十年也標誌著當CGI成為更多先進,更現實地鋪平了道路的機會,或者複雜的曆史主題。例如,電影等愛爾蘭人的(使用回春技術),1917年和第一個男人適合一個“奧斯卡誘餌”杜拉拉和都獲得奧斯卡獎提名的特效。
結論
所以,奧斯卡誘餌是真的嗎?
盡管我們的研究沒有因素在營銷等模式影響和代表性的學院成員決定提名和獲獎的電影,它確實表明許多電影被奧斯卡以外的“奧斯卡誘餌”比喻。在許多情況下,標簽等具體電影過於簡單了,忽略了整體電影的趨勢。我們好奇的想看看如果第94屆奧斯卡獎的發展這個故事。
有興趣嚐試類似的分析嗎?了解更多關於δ住表通過請求私人預覽。
更多關於IMDb
與數以億計的搜索數據項——包括800萬年的電影、電視和娛樂冠軍,1100萬年和1200萬年的演員和劇組成員的照片——IMDb是世界上最受歡迎的和權威的信息來源電影,電視節目和名人,結合網絡和移動用戶每月超過2億遊客。
IMDb增強了娛樂體驗讓球迷和世界各地的專業人士與演員和工作人員清單為每個電影,電視劇和視頻遊戲,一生票房票房從票房魔力,專有的電影和電視用戶評級從IMDb的全球觀眾超過2億的粉絲,等等。
從其龐大的和權威的數據庫IMDb許可證信息給第三方企業,包括電影製片廠、電視網絡、流媒體服務和有線電視公司,以及航空、電子產品製造商、非營利組織和軟件開發人員。學習更多在developer.imdb.com。