تكنولوژی گوگل «جدا از مشكلات مقیاس گذاری تكنیك های جستجوی قدیمی، برای داده های به این اندازه، تكنیك های جدید رقابتی كه استفاده از نمایش اطلاعات اضافی در فرا متن ها را برای نتیجة جستجوی بهتر شامل میشود وجود دارد… خیزش سریع تكنولوژی برای جمع آوری مستندات وب و نگهداری آن ها بصورت بروز لازم و ضروری است فضای ذخیره سازی باید به نحو موثری جهت ذخیرة ای
قیمت فایل فقط 2,300 تومان
«جدا از مشكلات مقیاس گذاری تكنیك های جستجوی قدیمی، برای داده های به این اندازه، تكنیك های جدید رقابتی كه استفاده از نمایش اطلاعات اضافی در فرا متن ها را برای نتیجة جستجوی بهتر شامل میشود وجود دارد… خیزش سریع تكنولوژی برای جمع آوری مستندات وب و نگهداری آن ها بصورت بروز لازم و ضروری است. فضای ذخیره سازی باید به نحو موثری جهت ذخیرة ایندكس ها و مستندا تشان استفاده شود. سیستم indexing باید صدها گیگابایت از داده ها را به شكل موثری پردازش كند. پرس وجوها باید با سرعت صدتا هزار بار در هر ثانیه انجام شوند» سرجی برین ولاورنس پیج، 1997 [1]
در ابتدا BackRub وجود داشت، سرویسی كه به گوگل تبدیل شد. امروزه گوگل با دقت بیشتری به الگوریتم pageRank خود وابسته است. PageRank الگوریتمی انتخابی است كه ارزش را به چیز مهمتر می دهد. نشانگر اهمیت یك صفحة وب تعداد صفحاتی است كه به آن صفحة خاص لینك می شوند.
آقایان بِریِن و پِیچ خیلی زود فاكتور جدیدی را به این الگوریتم اضافه كردند كه رأی را به صفحة مهمتر می داد. ایدة آنها این بود كه صفحه ای مهمتر است كه تعداد افراد بیشتری بر روی آن كلیك می كنند.كلیك های بیشتر روی یك صفحة وب باعث می شد كه آن صفحه وب دارای ارزش و اهمیت بیشتری شود. در انتها، آرام آرام فاكتورهای دیگری نیز به این الگوریتم اضافه شد. برای مثال ، تعداد دفعاتی كه محتوای یك صفحه تغییر
می كند نیز یكی از فاكتور های مهم شد.
تكنولوژی pogeRank گوگل دقیقاً به جستجوی اینترنتی وابسته شده است. برای نمونه، الگوریتم رأی گیری(Voting Algorithm) كارایی كمتری در عمل جستجو دارد. توجهی كه گوگل نسبت به تكنولوژی جستجویش كرد، باعث تحت الشعاع قرار گرفتن افكار عمومی راجع به این شركت شد. جستجوی گوگل همانند یك ستارة نوظهوراستكهدرخشندگیاش باعث شده تا ناظران نتوانند جهات دیگر این پدیده را به وضوح و دقیق مشاهده كنند.
صرف نظر از این ، گوگل یك شركت تكنولوژی است[2]بعضی از این تكنولوژی ها هنگامی كه دریك مقاله توضیح داده می شوند مانند مقالة “The Anatomy of a Large –Scale Hypertextual” كه در همان اوایل مطرح شد، خواستار پیدا می كنند. مقاله های اخیر مانند
“MapReduce: Simplified Data search Engine" می توانند به آرامی خوانده شوند[3] با توجه به اینكه گوگل یك تكنولوژی است، توضیح دادن اینكه گوگل چكار می كند، درجملات ساده وقابل هضم قدری مشكل است. شكل زیر یك دید كلی از چهار چوب گوگل را ارائه می كند.
شكل 3-1: نمایی كلی از چهار چوب گوگل
مهمترین قسمت های تكنولوژی گوگل كه پایه و اساس دیاگرام Googleplex است شامل موارد زیر میشوند:
[a]: اصلاح لینوكس به منظور اجازه دادن به فایل های بزرگ و دیگر توابع درجهت دادن شتاب بیشتر به همة سیستم
[b]: یك معماری توزیع شده كه به برنامه های كار بردی و مقیاس بندی ها اجازه می دهد كه بدون توجه به نوع آنها و بدون نیاز به نصب سیستم عاملی دیگر به سیستم متصل شوند.
[c]: یك معماری فنی كه در هر سطح مقیاس بندی مشابه بهم هستند.
[d]: یك معماری مركزی وب، كه به انواع جدید برنامه های كاربردی، بدون محدودیت یك زبان برنامهنویسی اجازه می دهد تا ساخته شوند.
تكنولوژی گوگل از یك پیشرفت پیوسته و یا آنچه كه مدیران مشاور فنی ژاپنی به آن Kaizan می گویند بوجود آمده است. هر تغییر تكنیكی گوگل ممكن است برای كاربران متوسط آن بی اهمیت باشد اما زمانیكه بصورت كامل آن را تفسیر می كنند مزایای فن شناسانة گوگل از ابداعات افزایشی و تصاعدی آن، سازگاری هوشمندانه و ماهرانة برداشت های پژوهشی – تحقیقی و تنظیم عالی بیزانس برای لینو كس حاصل میشود. زمانی، یك تاریخ نویس تكنولوژی ، از بین صدها پیشرفتی كه گوگل در این نُه سال اخیر آنها را رهبری كرده، قادر به تشخیص یك یا دو اختراع مهم كه برمبنای pageRank است خواهد بود. منتقدین گوگل در آینده خواهند دید كه گوگل هستة پردازش تكنولوژی خود را با منابع مختلف پیوند زده است. جهت توضیح ، ساختار مراكز دادة گوگل و ارسال پیام به این مراكز و از این مراكز به جاهای دیگر راههای زیادی وجود دارد كه از طریق محاسبات شبكه ای صورت می گیرد.[4] توانایی گوگل در خواندن داده بصورت همزمان از كامپیوتر های مختلف ، یادآور تكنولوژی BiTorrent است.[5] گوگل از سخت افزار مناسب یا “White box" در مراكز داده اش استفاده می كند كه نشان دهندة خصلت كامپیوتر دوست بودن گوگل است. استفاده از حافظه و دیسك ها برای ذخیرة چنیدن كپی از داده ها ناشی از محدودیت های محاسباتی است.
گوگل به تكنولوژی دست یافت، سپس آنها را گلچین كرد و از راههای مختلف نزدیك شدن یك بلاك ساختمان، را به سیستم های با مقیاس بزرگ نمایش داده گوگل از این گلچین كردن و دسته بندی كردن سودهای زیادی برد كه از آن جمله می توان به این موارد اشاره كرد: اولاً چهارچوب محاسباتی گوگل عملكرد سیستم را از سخت افزارهای كم هزینه وبا قیمت نازل جدا كرد. دوماً، گوگل درمورد تنگناهای سیستم عامل هایی از قبیل Solavis ، ویندوز سرور پیشرفته و لینوكس های آماده كاركرده است. سوماً ، گوگل ایده های برنامه نویسی خوبی از زبانهای برنامه نویسی دیگر گرفته ، و توابع و كتابخانه های جدیدی را جهت حذف بیشتر نیازهای كدنویسی دستی برای موازی سازی یك برنامه كاربردی در سر تاسر سرورهای گوگل پیاده سازی كرده است.[6]
طبق نظر جف دین كه یكی از مهندسان ارشد گوگل است، مهندسی گوگل ترتیبی از آشفتگی هاست.[7] این سخن نه شگفت انگیز است ونه لزوماً سخنی منفی است. Googleplex جعبه ای است كوچك جهت برنامه نویسی و طراحی وابزارهای آن پیچیدهوغیرطبیعی اند. مقابله با مشكلات گوگل را تبدیل به مكانی برای بهترین و درخشنده ترین تكنیك های جهان كرده است. طبیعت خلاق با حركت گوگل تركیب شده و همین امر پیش گویی ابداعات بعدی گوگل را مشكل ساخته است. قبل از مرور دقیق تر قسمت های انتخاب شده از تكنولوژی گوگل ، دیاگرام «چهارچوب محاسبات گوگل» مروری بر Googleplex و برخی از تكنولوژی های آن ایجاد می كند و موضوع بحث این فصل نیز راجع به همین مقوله خواهد بود.
Page Rank جهت كار كردن به مقدار زیادی سیكل محاسبات بر حسب اسب بخار نیاز دارد. هنگامیكه گوگل در سال 1996 در حال پیشرفت بود آقایان برین و پیچ محاسبات را محدود كردند. برای اینكه pageRank كار كند، آنها مجبور بودند طریقة تولید الگوریتم pageRank را بر روی كامپیوترهای معمولی و پیش پا افتادة موجود بفهمند. از ابتدا- و با توجه به تصادف پیشرفت تقریباً مسلم گوگل با مایكروسافت این نتیجه مهم است- گوگل باید مشكل مهندسی نرم افزار و سخت افزار خود را برای به موفقیت رسیدن جستجوها حل می كرد. در حقیقت هنگامیكه راجع به تكنولوژی گوگل بحث میكنیم خیلی مهم است كه در ذهن خود این موضوع را داشته باشیم كه pageRank تنها به این دلیل مهم است كه می تواند به سرعت دردنیای واقعی اجرا شود ونه در یك كامپیوتر بی بار ویا دریك آزمایشگاه روشن همراه با نور آبی سوپر كامپیوترها.
شكل تركیبی گوگل: مهندسی نرم افزار وسخت افزار نشان می دهند كه چهار چوب تكنولوژی گوگل دارای دو ناحیة فعالیت است. یك قسمت مهندسی نرم افزار است كه تلاش می كند روی pageRank ودیگربرنامههایكاربردیمتمركز شود.مهندسینرم افزاری كه در اینجا بكار رفته است به معنای نوشتن كد و فكر كردن دربارة اینكه چگونه یك سیستم كامپیوتری عمل كند تابیشترین سرعت عمل را داشته باشد است. سرعت عمل یعنی زمان پاسخ گویی زیر یك ثانیه ، كه گوگل قادر است علی رغم افزایش كاربران، برنامه های كاربردی و پردازش داده ها، آن را حفظ نماید.
3-2:تركیب گوگل: نوآوری سخت افزار و نرم افزار
شكل 3-2: نمای تركیبی گوگل
قسمت دیگر برروی سخت افزار متمركز شده است. گوگل دارای رك های سرور، مكانی برای كابل ها، وسایل خنك كننده و لایههای مراكز داده است. بازدهیازهزینههای عملیاتی پائین تر است و توانایی مقیاس بندی، بعنوان درخواستی برای افزایش منابع محاسباتی است. با یك گردش سریع تر و حذف كارهای پردرد سر همانند پشتیبانی گرفتن از داده ها، ابداع سخت افزار گوگل، آن را به یك مزیت رقابتی تبدیل كرده است كه بعضی رقبای آن می توانند دراواسط سال 2005 با آن برابری كنند.
Page Rank به همراه لایه های محاسباتی اضافی كه در طی چند سال اضافه شد باعث مشكلات نرم افزاری قابل ملاحظه ای شده است. سیستم گوگل باید صفحات وب را پیدا می كرد و دوجین از آنها را اجرا می نمود، اگرنبودباید صدها صفحة وبراآنالیزمی كرد. یك لینك كه به یك صفحه اشاره می كند را درنظر بگیرید، گوگل باید یك توالی ازآنها را برای 8 میلیارد صفحة وب نگهدارد.
برای یك صفحة وب تكی همراه با یك لینك كه بهآناشارهمیكند مشكل جزئی وبی اهمیت است. یك لینك معادل یك اشاره گر می باشد، اما چه اتقاقی ممكن است رخ دهد زمانیكه یك سایت دارای 10000 لینك باشد كه به آن اشاره می كند گاهی اوقات مشكل خیلی بزرگ میشود و محاسبات قابل توجهی لازم دارد. بعضی از این لینك ها احتمالاً از سایت هایی كه دارای ترافیك بیشتری نسبت به بقیه هستند می آیند و بعضی دیگر ممكن است از سایت هایی كه قصد مسخره كردن و دست انداختن گوگل برای تفریح و سرگرمی دارند آمده باشند. محاسبات مرتب كردن مقدار هر كدام از این لینك ها، به كار محاسباتی كه به pageRank مربوط میشود اضافه می گردد كه داشتن حساب این فاكتورها كاربزرگی است. اندازه گیری فاكتورهای مختلف بر ضد یكدیگر، برای یك صفحه اگر بدون كمك یك ماشین حساب انجام شود می تواند كار مشكلی باشد. این محاسبات را در نظر بگیرید و آن رابه دو میلیادر صفحة وب اعمال كنید و سپس وظایف محاسبات را به یك سوپر كامپیوتر بدهید.
هنوز هم این كار، هرروزه وقت گوگل و پردازش های pageRank آن را پر می كند. كاربران به این موضوع فكر نمی كنند كه چرا تكنولوژی، یك روال جستجو یا سیصد میلیون پرس وجوی گوگل كه هر روز نیز بكار می برد را تأیید می كند. تكنولوژی گوگل، در یك ثانیه در حدود سیصد و چهل پرس وجورا به دوازده زبان از كاربران دنیا انجام می دهد.
تكنولوژی گوگل را نمی توان از جستجو متمایز كرد زیرا جستجو اصلی ترین محرك در دنیای گوگل بوده است. هنگامیكه آقایان برین و پیچ توانستند با تعداد محدودی كامپیوتر كار كنند والگوریتم pageRank را راه اندازی نمایند، آن وقت بود كه گوگل در یك جادة سرازیری قرار گرفت. نرم افزار احتیاج به سخت افزار وزیر ساختار های شبكه ای مناسب دارد تا بتواند كار كند. اگر سخت افزار و نرم افزار گوگل نبود، گوگلی هم وجود نداشت.
در گوگل سخت افزار و نرم افزار بشكل جدانشدنی به هم پیوند خورده اند. با هر ویژگی جدید در نرم افزار، مهندسین گوگل باید متقابلاً یك ویژگی مهم را به سخت افزار اضافه نمایند و هنگامیكه یك ویژگی جدید به سخت افزار اضافه میشود، مهندسین گوگل با حرص و طمع از این ویژگی برای عملكرد بهتر نرم افزار استفاده می كنند.
دارایی های گوگل عبارتند از: سوپر كامپیوتر ها، ابزارهای نرم افزاری جالب و چندین هزار كاربر كه تلاش می كنند تا بفهمند Googleplex چه كارهای دیگری می تواند انجام دهد. بعضی از سرهم بندی ها از مشكلات ناشی از بیت ها وبایت ها، نوشتن كد و سرهم كردن برنامه های كاربردی خارج از توابع موجود ناشی می شوند كه نتیجه یك محصول خیره كننده، خواهد بود. مشكلات دیگر از لحیم كردن و جوش دادن آهن و كاربا ابزار آلاتی مانند پیچ گوشتی بوجود می آید. اینمهندسین بدنبالراهحلیبرایساختنسخت افزار و سیستم فیزیكی هستند كه بتواند محاسباتی را كه برای راه اندازی pageRank مورد نیازاست انجام دهد. نزدیكی گوگل به مراكز داده، رك ها درمراكز داده و وسایل موجود در رك ها كه در مراكز داده قرار دارند، چابك تر از سیستم جستجوی شركت هستند. سخت افزارها باید هوشمند تر گردند. سخت افزارها باید بصورت 7×24، درشرایط بارگذاری پیوسته و در مكان هایی از سوئیس تا پكن كار كنند. تناسب بین سخت افزار ونرم افزار شاید یكی از موفقیت های مهم گوگل بوده است.
3-3:چگونه گوگل از یاهو و MSN متمایز میشود
تكنولوژی گوگل همانند دیگر تكنولوژی های شركت های آنلاین بصورت همزمان و مقارن است، اما در عین حال خیلی متفاوت از آنهاست. معمولاً یك مركز داده، تسهیلاتی بدست آمده است؛ و بوسیلة شخص ثالثی ، جایی كه مشتری سرورهای خود را در آنجا قرار می دهد بكار انداخته میشود. كاركنان و پرسنل مركز داده، قدرت، وضعیت هوا و نگهداری روال ها را مدیریت می كنند. مشتری، كامپیوتر و كامپوننت هارامشخص می كند. هنگامیكه یك مركز داده باید توسعه داده شود، كادرتسهیلات باید تقریباً تمام كارهای روزمرة خود را انجام دهند و ممكن است با مهندسین مشتری برای برخی وظایف تخصصی كاركنند. قبل از نگاه به تفاوت های مهم گوگل و دو رقیب بزرگ او، با هم لیستی از ویژگی های مراكز دادة گوگل را مرور میكنیم.
1- اكنون تعداد مراكز دادة گوگل به حدود بیست و چهار عدد رسیده است گرچه خارج از گوگل هیچ كسی دقیقاً تعداد مكانهای آنها را نمی داند. آنها بصورت آنلاین و بطور اتوماتیك، تحت هدایت فایل سیستم گوگل ، شروع به كاركردن از دیگر مراكز داده می كنند. این تسهیلات و قابلیت ها، بعضی اوقات با 10000 كامپیوتر گوگل یا بیشتر صورت می گیرد كه یكدیگر را پیدا كرده و خودشان را پیكر بندی می كنند و تمام این اعمال را با كمترین دخالت انسان انجام می دهند.
2- سخت افزارهای مراكز دادة گوگل را می توان از مغازه های محلی كامپیوتر تهیه كرد. گوگل از همان نوع حافظه ، دیسك درایو و فن ها ومنابع تغذیه ای كه دركامپیوتر های شخصی رومیزی بكار می رود استفاده می كند.
3- هر سرور گوگل در یك وضعیت استاندارد كه pizza box نامیده میشود همراه با یك تغییر مهم حاصل میشود و آن این است كه دوشاخه ها و پورت ها در جلوی جعبه قرار دارند تا دستیابی راسریع تر و آسان تر نمایند.
4- رك های گوگل طوری مونتاژ شده اند كه می توانند سرورها را در جلو و عقب خود نگه می دارند. این كارایی به رك های استاندارد كه معمولاً چهل pizza box را در خودنگه می دارند اجازه می دهد تا هشتاد pizza box را در خودجای دهند.
5- یك مركز داده گوگل می تواند در كمتر از 72 ساعت از پشتة قسمت به عملیات آنلاین رود، بر خلاف بیشتر مراكز داده كه یك هفته یا حتی یك ماه زمان نیاز دارند تا منابع اضافی را بصورت آنلاین دریافت نمایند.
6- هر سرور ، رك و مركز داده در مسیریهمانندچیزیكه plug and play نامیدهمیشود كار می كند مراكز دادة شبكة گوگل هنگامیكه منابع جدیدی به آن متصل میشود متوجه می شوند، همانند اتصال ماوس به پورت USB در یك كامپیوتر laptop. این منابع برای بیشتر قسمت ها بطور اتوماتیك وبدون دخالت انسان وارد عمل می شوند.
بعضی از این فاكتورها وابسته به نرم افزار هستند همانطور كه ذكر شد، این روی هم افتادن بین نرم افزار وسخت افزار در گوگل ، نمایش دهندة ارتباط همزیستی بین دو رشتة مختلف مهندسی است. از همان آغاز، نرم افزار و سخت افزارِ گوگل به شكل محكمی به یكدیگر وابسته بوده اند. گوگل یك شركت نرم افزاری یا سخت افزاری نیست، بلكه شبیه به شركت IBM می باشد كه وجودش را هم مدیون سخت افزار و هم نرم افزار است . اما برخلاف IBM ، گوگل مدلی تجاری دارد كه توسط آگاهی دهنده ها و اعلان كننده ها حمایت میشود. از نظر تكنیكی گوگل به IBM (از منظر شركت سخت افزاری و نرم افزاری) ، به مایكروسافت (ازمنظر شركت نرم افزاری) و به یاهو (بعنوان تركیبی از چند نرم افزار) نزدیك است.
مهندسی نرم افزار و سخت افزار در گوگل به آسانی نمی تواند تفكیك شود. در MSN و Yahoo ، سخت افزار و نرم افزار بطور خیلی بی ربط تر با یكدیگر تركیب شده اند. دو مثال زیر این تفاوت ها را به روشنی بیان می كند.
مایكروسافت- با مقداری گردش كم درون ماشین های بازی Xbox و وسایل جانبی- سیستم های عامل و برنامه های كاربردی قدیمی را برنامه ریزی كرد. مایكروسافت دارای چندین سیستم عامل است و مهندسین مایكروسافت نیز به سختی برروی نسل بعدی سیستم های عامل كار می كنند . مایكروسافت سخت افزار خود را نمی سازد یا طراحی نمی كند. سیستم عامل های مایكروسافت بصورت رمزی است. برای مثال، برای پردازنده هایی كه از چیپ های اینتل برای كامپیوترهای شخصی در آورده شدهاند. اخیراً مایكروسافت راه جدیدی را با ماشین های بازی اش یعنی Xbox 360 شروع كرده است این Xbox جدید از پردازنده ای از خانوادة IBM از چیپ های Power PC كه همچنین در كامپیوتر های مكینتاش، 3/Sohy PS و ماشین های بازی نسل بعدی Nintendo بكار برده شده استفاده می كند. برنامه های كاربردی مایكروسافت بر روی سیستم عامل های مایكروسافت اجرا می شوند، گرچه نسخه ای از مایكروسافت آفیس و اینترنت اكسپورر می توانند برروی مكینتاش اجرا شوند.
علاوه بر این . مایكروسافت از شركت های تولید كنندة مختلف سخت افزار را خریداری می كند تا سیستم های آنلاین را اجرا نماید. بیشتر این شركت های تولیدی، نه بطور شگفت آوری، بوسیلة مایكروسافت تصدیق شده اند. مثال های آن شامل استفاده مایكروسافتازكامپیوترهایدلاست.مهندسینمایكروسافتازاینماشینهادرپیكربندی هایی كه به سیستم عامل های مایكروسافت وبرنامه های كاربردی نیاز دارند استفاده می كنند. برای مثال ، سرورهای مایكروسافت اغلب به خاصیت تعادل بار نیاز دارند. مایكروسافت تعادل بار خودش را از طریق نرم افزار پیاده سازی می كند. هنگامی كه احتیاج به عملكرد بیشتری باشد، مایكروسافت سخت افزار را بروز می كند، حافظه اضاف می كند، یا به تكنولوژی سرعت بالاتر هارد درایو بجای اینكه سیستم عامل خودش عملكرد بالاتری را همچنان كه گوگل انجام می دهد اجرا كرده وتحویل دهد تغییر جهت می دهد. هنگامی كه یك كار به خریدار تحویل داده میشود مهندسین مایكروسافت بر روی فرونشاندن خطاها تمركز می كنند. دوباره مهندسی یك برنامه كاربردی نرم افزار برای عملكرد بالاتر مخصوص یك اولویت نیست.
چندین نگرش بصورت ضمانت شده هستند:
1- برخلاف گوگل ، مایكروسافت بر روی عملكردبعنوانیكپایاندرخودشتمركز نمی كند. بعنوان نتیجه، مایكروسافت عملكرد را با روشی كه بیشتر كاربران كامپیوتر انجام می دهند می گیرد. مایكروسافت یا ماشین هایش را بروز می كند ویا آنها را می خرد. مایكروسافت با سیستم های عاملش و زیر كارهایش برای گرفتن آن قطعه زمان اضافی ، كارهای بیهوده انجام نمی دهد.
2- بر خلاف گوگل ، مایكروسافت باید سیستم های عامل زیادی را پشتیبانی نماید و زمان وانرژی را درمعین ساختن آن برنامه های كاربردی و میراث مهم از قبیل مایكروسافت آفیس یا SQl Server صرف كند تا بتواند بر روی این سیستم های عامل جدید اجرا نماید. مایكروسافت لنگرقایقی دارد كه به زانوان مهندسین خود بسته است. لنگر قایق برای اینكه مایكروسافت مطمئن شود كه رمز میراثی اش در آخرین و بزرگترین سیستم های عاملش كار می كند احتیاج است.
3- بر خلاف گوگل ، مایكروسافت مسیر مهم ثبت شده ای در طراحی و بنای سخت افزار برای محاسبات توزیع شده و عظیم موازی شده نداشت. ماوس ها و صفحه كلیدها موفقیتی بحساب می آمدند. مایكروسافت پیوسته برروی Xbox پولراازدست می دهد وناگهان وفات ورود مایكروسافت به درون بازار سخت افزار شبكة خانگی، مدارك بیشتری را مبنی بر اینكه مایكروسافت صلاحیت و شایستگی سخت افزاری همانند گوگل ندارد را فراهم می كند.بر حسب تكنولوژی، گوگلمهندساننرمافزاروسخت افزار خبره ای برای ایجاد سریع برنامه های كاربردی ، انجام دادن بسرعت برنامه های كاربردی محاسباتی – متمركز و اجرای سرویس های با قابلیت اعتماد بالا از سخت افزار مناسب و با قیمت پائین را دارد.
یاهو متفاوت از گوگل و مایكروسافت عمل می كند و در اواسط سال 2005 یك رقیب مستقیم برای گوگل درتبلیغ و آگهی های تجاری بحساب می آید. یاهو بواسطة سودهایی كه كسب می كند رشد كرده است بعنوان مثال در جستجو، یاهو com 3721. را برای بكار بردن زبانهای چینی در جستجوی اطلاعات و همچنین بازیابی آنها صاحب شده است . یاهو Inktomi را برای فراهم نمودن جستجوی اطلاعات در وب خریداری كرد و بعلاوة آن آزمایشگاههای Stata رابرایتهیةكاربرانیباجستجووبازیابیپستالكترونیكی یا هوشان خریداری نمود. یاهو همچنین مالك سایت Alltheweb.Com كه یك سایت جستجوی وب با جستجو وانتقال سریع است نیز می باشد. همچنین یاهو، مالك پیش درآمد تكنولوژی جستجو با استفاده از اعلان كننده ها برای تعیین كلمات كلیدی وبیان آنها و همچنین مالك Alta Vista سیستم جستجوی وب كه بوسیلة شركت تجهیزات دیجیتال توسعه یافته است نیز می باشد. یا هو اجازة رسمی جستجوی InQuira برای اعمال پشتیبانی مشتری را می دهد. نكتة جالب آن است كه یاهو یك تكنولوژی جستجوی درهم آمیخته دارد درحالی كه گوگل، تنها دارای یك تكنولوژی جستجو است.
بصورت تاریخی، یاهو كمپانی تكنولوژی ها را داراست وبه هر كمپانی اجازه می دهد تا تكنولوژی خود را در یك سیلو بكار اندازد. یكپارچگی این تكنولوژی های مختلف زمانی را صرف می كند كه فعالیت پرخرج و گرانی برای یاهو محسوب میشود. هر كدام از این نرم افزارهای كاربردی به سرورها و سیستم هایمخصوصبرایهرتكنولوژینیازمند اند. نتیجه آن میشود كه یا هو یك موزاییك از سیستم های عامل ، سخت افزار و سیستم ها را داراست. مشكل یاهو متفاوت از مشكل میراث مایكروسافت، boat-anchor است و آن مواجهة یاهو با مشكل Balkan-states است. صداها، احتیاجات ونیازها و ضد علاقه های زیادی وجود دارند، اما یاهو باید در مدیریت منابع برای محافظت از صلح وادامه دادن به آن سرمایه گذاری كند. یاهو صلاحیت مركزی درمهندسی سخت افزار برای سطح كارایی و پایداری را ندارد هر چند كه ممكن است شایستگی قابل توجهی در پشتیبانی crazy-quilt سخت افزار وسیستم های عامل داشته باشد. شایان ذكر است كه یاهو یك كمپانی مهندسی نرم افزار نیست. مهندسین یاهو از طریق یك پرتال ، تابع ها و كاركردهایی را از سیستم های ناهمخوان بوجود می آورند.
گوگل نیز تكنولوژی ای را بدست آورده كه بعنوان یك مثال خوب از آن، می توان پیكاسا رانام برد. پیكاسا نرم افزار مدیریت تصاویر است كه بر روی كامپیوترهای شخصی كه دارای سیستم عامل ویندوز هستند قابل اجراست . این برنامه بصورت یك برنامة یكپارچه كه از چندین برنامة كاربردی مركز- شبكة گوگل تشكیل شده است می باشد.
1- Gmail : كاربر می تواند تصاویر خود را از طریق پست الكترونیكی به دوستان، همكاران ویا خانوادة خود ارسال كند. كاربرِپیكاسا بدون داشتن حساب كاربری Gmail نیز قادر به ثبت و دریافت نام كاربری و رمز عبور می باشد. اگر كاربری تمایل داشته باشد می تواند از حساب كاربری Gmail نیز برای سرویس های دیگرِ گوگل نظیر Fusion كه پرتال شخصی گوگل است و یا تابع جستجوی تاریخ كه پرس وجوهای اخیر كاربران را ذخیره می كند نیز استفاده كند.
2- Blog Publishing: كاربر می تواند تصاویر مورد نظر خود را به Blogger. Com پست كند. تابع انتشار تصاویر بقدری ساده است كه با یك یا دو كلیك قابل انجام است. پست تصاویر به برخی سیستم های وبلاگ، برتر از خبرگی ومهارت بسیاری از كاربران كامپیوتر است.
3- Image Printing : كاربر می تواند تصویر مورد نظر خود را به سرویس پردازش تصاویر كه بصورت آنلاین است ارسال كند.
|
در مقابلة تند به رویكرد یاهو، گوگل برنامة كاربردی پیكاسارا درون Googleplex یكپارچه كرده است. “Hooks” برای كاربران چیزی بی درد و رنج است.[8] گوگل درون یك برنامة كاربردی اشاره- و – كلیك، راه حلی برای ایجاد مدیریت تصاویر دیجیتالی شهودی و سیال را دسته بندی كرده است. بطور كلی برنامه های قابل استفادة یاهو بصورت درستی درون یك بستة یكپارچه همراه با دیگر سرویس های یاهو قرار ندارند. سیستم جستجوی com.3721 را مشاهده كنید، این سرویس باقی ماندة عملیات زبان چینی موجود از صفحات غیرانگلیسی یاهوست. گوگل ، برنامه ای كاربردی رابا استفاده از بعضی كدهای موجود بر روی كامپیوتر های خانگی كاربران و دیگر نرم افزارها طرح ریزی كرده كه در حال اجرا كردن بر روی Googleplex ، درمحلی دراینترنت است. این سه كمپانی در برخورد با یكدیگر، در ساختار و نقاط تكنیكی متفاوت اند مانند كشتی ها در جام آمریكا كه هر كدام هدفی را دنبال می كردند اما موضوع نبرد برای سكانداران كه وظیفة كنترل كشتی را بر عهده داشتند چیز دشواری بود. حتی با وجود اینكه، بین این سه كمپانی، فضایی تجاری وجود دارد اما برخورد ها اجتناب ناپذیراند. جدول زیر نظری است كلی و اجمالی در مورد مسائل تكنیكی سه كمپانی گوگل ، یاهو ومایكروسافت در
میانة سال 2005 .
| Yahoo | MSN | |
كفایت و قابلیت مهندسی | چند رسانه ای | نرم افزار | سخت افزار بعلاوة مهندسی نرم افزار |
قدرت تكنیكی | تكنولوژی پرتال | تكنولوژی دات نت | عملكرد بالای برنامه های كاربردی وب |
ضعف تكنیكی | یكپارچگی سیستم | امنیت | بازبینی و نظارت شبكه |
رقابت تكنیكی عمده | متحد كردن و یكی كردن سیستم ها | امنیت | كیفیت بالای كارمندان تازه استخدام شده |
MSN و شركت مایكروسافت در بخش نرم افزار دارای شایستگی ولیاقت اند. این كمپانی از ریشه های سیستم عاملش برای تهیة محدوده ای از محصولات برای وسایل موبایل ، كامپیوترهای رومیزی، نوت بوك و همچنین اقدام در مورد كلاس سرورها رشد یافت. با نگاهی به آینده خواهیم دید كه كمپانی تكنولوژی دات نت در چهار چوب مایكروسافت برای تولید برنامه های كاربردی مجازی فعالیت می كند. دربعضی روش ها، دات نت یك نسخة كمتر باز شده از تكنولوژی AJAX است كه گوگل از آن درمحصولات Gmail و نقشه هایش استفاده می كند. شركت مایكروسافت هزینة زیادی را برای جلو بردن ویندوز به سمت پایین برای دستگاههای موبایل وبه سمت خارج برای كامپیوترهای متمركز در شبكه صرف می كند تا بتواند منافع و بازده خود را افزایش دهد. برای ادامه دادن در آینده، مایكروسافت باید درقسمت نرم افزارمسلط و حكمفرما باشد. هر چند موقعیت مایكروسافت (خواه بصورت واقعی ویا بصورت ظاهری ) آسیب پذیری محصولاتش در شكافهای امنیتی است، اما این كمپانی باید با قدرت ، سهمی را از بازارتجارت برای برنامه های كاربردی متمركز شبكه تسخیر كند.
وصله بعد از وصله، مشكل بعداز مشكل و سپس قول دادن بعد از قول دادن كمی اعتبار شركت را برای تحویل سیستم های امن ونرم افزار به خطر انداخت. با نگاهی به 12 تا 18 ماه بعد خواهیم دید كه شانس موفقیت مایكروسافت منوط به امنیت ، هزینه و اجتماع افراد نرم افزار نویس است.
رشد بازمتن ها بطور متناوب ، دلیل محكمی بر این است كه مایكروسافت مرگ سختی را پیش رو خواهد داشت و كاربران مایكروسافت برای امنیت و همچنین ذخیرة پول های خود راضی به تغییر هستند. بنابراین می توان گفت: مایكروسافت ضعیف تر از آن است كه بتواند به دیگر رقبای خود نظیر گوگل حمله كند.
موقعیت یاهو یك نمونة بارز برای بسیاری از سازمانها و تشكیلات آمریكایی است. بیشتر شركت های بزرگ آمریكایی ، یك سرهم بند سیستم های مختلف، معماری های ناموفق و طرحها ونقشه های غیر عملی فرمت های داده اند. یاهو برای اجرای طرح ویژة مركز تجارت برای آگاهی دهنده هایش ، باید اطلاعاتی را از سیستم های مجزا جمع كرده وآنها را یكپارچه نماید، اما یاهو اكنون در حال خرج كردن پول برای شكستن دیوارهای سیلوهای داده ویكپارچه كردن داده های كاربرانش است. اگر یاهو نتواند بخش های بازاریابی را بدقت ارائه دهد ، ممكن است اعلان كننده ها، یاهو را برای سرویس هایی كه پیشنهاد می كند و هدف آن بیشتر فرصت بازاریابی است رها كنند. بعد از سالها حركت تند وسریع و اكنون كه آمریكا در مرحله ای جدید بسر می برد كه به سن جدید آمریكای آنلاین معروف است، اكنون یاهو درحال شروع رفتاریهمانند رفتاریككمپانی رسانه های قدیمی است.
MSN و یاهو در حال توانستن پشتیبانی از نسخه های جالب و عمومی پرتال ها مانند یاهو، America Online و Tiscali هستند. در مقابل، گوگلدرحال تمركزبررویبرنامه های كاربردی است كه كاربران رابه Googleplexمتصل می كند. تمركز كمپانی برروی مهندسی نرم افزار و سخت افزار مزیت های عملكرد و هزینه را بر روی یاهو و MSN در میان رقابت های دیگران در جستجوی وب به آن می دهد. عملكرد بالای گوگل؛ Googleplex همگن و متوافق بدین معنی است كه كمپانی با بعضی یكپارچگی ها، عملكرد وبرآمد هزینه كه مایكروسافت و MSN را محصور می نماید تقلا نمی كند. گوگل ممكن نیست هر چیزی را ازنقطه نظر علم كامپیوتر صحیح انجام دهد اما در مقایسه با یاهو و MSN ، گوگل اشتباه كمتری را از این دو رقیب مهاجم انجام می دهد.
تكنولوژی گوگل از راهكارها و تكنیك هایی از عمدة علم كامپیوتر استفاده می كند. بیشتر این نوآوری ها برای توضیح به مهندسینی كه درروش های قدیمی محاسبات توریع شدة بزرگ وموازی غرق شده اند مشكل است. پانوشت ها ومرجع ها در اوایل روزنامة BackRub در ارائه تكنیكی اخیر گوگل تقلب شده بود.[9] برای فهمیدن هدف این ویژه نگاشت وطبیعت تكنولوژی گوگل ، پنج مقررات از طریق روزنامه های تكنیكی گوگل و در ارائه های بیان شده اند. عكس های گرفته شدة بعدی كه خیلی مختصر سازی نیز شده اند چیزی بزرگ و پیچیده را بیان می كنند وآن تصویر Googleplex است.
گوگل از سخت افزار مناسب برای تقاضا های زیاد استفاده می كند، سیستم های 7*24از سال 1996 بعنوان هسته ای اصلی و فنی وجود دارند. بیشتر سیستم های آنلاین رقبا، تركیبی از سخت افزارهای تجاری IBM ، Sun Microsystems ، Hewlett-Packard و كامپیوترهای Dell همراه با وسایل جانبی ویژه هستند. سیستم عاملیكهاستفاده میشود، تركیبی از یونیكس و سیستم عامل مایكروسافت همراه با تعدادی كامپوننت های لینوكس و بازمتن است. گوگل به مشكل كاهش قیمت سخت افزار، نصب آن ، تست گرما برای اجزای الكترونیكی ونگهداری آنها نزدیك میشود. از تعداد زیادی وسایل ارزان وكنترلرهای مناسب كه بصورت انبوه وجود دارند و همچنین كابل ها وحافظه ها كه هزینه را كاهش می دهند استفاده میشود اما نكته ای كه باید به آن توجه كرد این است كه سخت افزار ارزان كار نمی كند. برای كم كردن هزینة از كار افتادن وسایل، گوگل فكر تهیه نرم افزار هوشمندی است كه هر آنچه وظایف هنگامی كه وسایل سخت افزاری از كار افتادند احتیاج به انجام آن دارد را انجام دهد. یك وسیله خود به تنهایی یا همگی رك ها در صورتی كه خرد شده و درهم بشكنند، باز هم سرتاسر سیستم از كارنمی افتد، اما این موضوع آنجا اهمیت بیشتری پیدا می كند كه وقتی از كار افتادگی وسیله یا یك رك اتفاق بیفتد تیم های مهندسی همراه با پرسنل تكنیكی خود در اسرع وقت آن را درست می كنند.
تمركز روی هزینه كم ، سخت افزار مناسب ونرم افزار هوشمند یكی از قسمت های فرهنگ گوگل است. در یك سخنرانی، دركنفرانس فنی سال 2004 سخنگوی گوگل به شوخی اعلام كرد كه هر كسی كه در این اتاق است بتواند همان سخت افزاری را كه گوگل در الكترونیك Frye استفاده كرده است بخرد، می تواند فروشگاهها ومواد درون آنها را در شهر Palo Alto و دیگر شهرهای كالیفرنیا نگه دارد.
مقالات و روزنامههای تكنیكی گوگل در مورد معماری Googleplex توضیحی نمی دهند، اما این مقالات وروزنامه ها درمورد تهیة سیستم های آنلاینی كه خصوصیات یك سرور تكی به اشتراك گذاشته شده را می سازد و عملكرد كلاسترِ سرورها ، یك مركز دادة كامل و گروهی از مراكز دادة گوگل امیدوار هستند.
دیاگرام زیر Googleplex سازمان یافته و متراكم، سازمان بندی با قاعدة فایل ها، سرورها، كلاسترها وبیش از دو جین مراكز داده در یك الگوی سازمان یافتة استوار را نشان می دهد.[10]
دیاگرام بالا روشن می سازد كه شالودة تكنیكی گوگل در بسیاری سطوح به Gooleplex
شباهت دارد. مجموعة سرورهایی كه برنامه های كاربردی گوگل را بر روی نسخة گوگل لینوكس اجرا می كنند یك سوپر كامپیوتراند. Googleplex مثل همیشه می تواند كارهای مشكل محاسباتی مانند گرفتن فرم های پرس وجوی كاربران و مطابقت آنها با مستندات گوگل كه ایندكس شده اند را انجام دهد. بیشتر، Googleplex می تواند محاسباتی را كه احتیاج به درجه ads درنتایج صفحات نشان داده شده به كاربر دارند، اجرای موازی، انتقال داده ها با سرعت بالا مانند كامپیوترهایی كه وسایل ذخیره سازی پیشرفته را اداره می كنند و كارهای مشكل ادارة منزل كه برای پیگیری و صدور صورت حسابها لازم و ضروری اند را انجام دهد.
چقدر جالب است كه گوگل این كار را با سخت افزارهای مناسب وارزان قیمت كه بر روی نسخة گوگل لینوكس در حال كاركردن هستند انجام می دهد. گوگل ، Googleplex را با منطقی كه اجازة بازیابی داده ها را به نرم افزار داده، كارآمد ساختن پیغام های فرستاده شده از یك سرور به سروردیگر و گرفتن منابع محاسباتی اضافی برای كامل ساختن سریع یك كار القا نموده است. هنگامی كه گوگل به اضافه كردن ظرفیت پردازش یا فضای ذخیره سازی اضافی نیاز دارد، مهندسین گوگل منابعمورداحتیاجرامتصل می كنند. در جهت مشابه، Googleplex می تواند منابع جدید را تشخیص دهد، پیكربندی كند و استفاده نماید. گوگل دارای انعطاف پذیری نامحدودی می باشد. برخلاف یك مجموعه از مواد ساختمان سازی مختلف، گوگل به اجرای یك سیستم كامپیوتری همگن نزدیك شده است.
یك مثال خوب آوردن یك رك جدید از چهل یا بیشتر سرورهای pizza box آنلاین و ایجاد یكی از انواع بسیار زیاد سرور های گوگل برای كاربران است.[11] سرورها، بر طبق معماری فراكتالی خود ، شامل دو یا بیشتر كلاسترهای pizza box هستند. یك كلاستر به داده ها اجازه می دهد تا بتوانند كپی شوند وبطور اشتراكی در میان pizza box هایی با ظرفیت یدكی كار كنند. یك رك بصورت جمع شده و آماده است وسپس ، سرورهای pizza box گوگل درون آن نصب می شوند. كابل ها در میان pizza box ها بسته شده اند و سپس رك به Network HUB متصل میشود. هنگامی كه یك مهندس، برق را روشن می كند وسایل دیگر از منابع جدید رك با خبر می شوند.master-servor ها به دیگر سرورها برای كپی داده به كلاستر جدید و شروع استفادة كلاسترها برای انجام كار دستور می دهند.
درمعماری گوگل، فقدان یك وسیلة تكی بی ربط است. در حقیقت، یك مركز داده می تواند از كار بیفتد بدون اینكه داده ای از دست دهد ویا Googleplex از كار بیفتد. سیستم عامل گوگل تضمین می كند كه هر فایل سه تا شش بار در وسایل ذخیره سازی مختلف نوشته شود. هنگامی كه یك كپی از آن فایل موجود نباشد، Googleplexاز یك log برای جستجوی كپی های فایل های مورد نیاز همفكری می كند و سپس برنامة كاربردی از نسخة المثنیِ فایل مورد نیاز استفاده كرده و پردازش كار را ادامه می دهد. اخراج و تغییر جزئی دیگر مهندسین ، برای این است كه لینوكس راههای Googleplex را برای حذف یا كاهش تنگناهای مرتبط با عملیات سیستمی كامپیوتر های آنلاین قدیمی بدست آورد. دستورالعمل تكنیكی گوگل شامل، محاسبات توزیع شده، بكار بردن فایلهایی بهینه شده ومنطق جاسازی شده برای ساختن سرورهایی است كه بر روی وظایف هوشمند تر كار كنند.
این معماری به گوگل اجازه می دهد تاظرفیتمحاسباتی، فضایذخیرهسازی وبرنامه های كاربردی پشتیبانی شده را گسترش دهد. برطبق گفتة جف دین كه یكی از مهندسین ارشد گوگل است. «در گوگل همه چیز درمورد مقیاس است.»[12]
3-7 :سرعت و سپس سرعت بیشتر
جستجوی گوگل بطور سریع و با بیشترین نتایج بر گشتی به كاربر، در كمتر از یك ثانیه انجام میشود. در مراكز دادة تجاری ، سرعت با خرید گرانترین سخت افزار همراه با بالاترین عملكرد بدست می آمد ، از این قبیل محصولات را می توان سان میكروسیستم نام برد كه در آن از وسایل ذخیره سازی پیشرفته ای كه به سرورهایی با فیبرهای نوری عجیب و غریب متصل شده اند استفاده میشود.
گوگل از سرورهای pizza box مناسبی كه درون یك كلاستر سازمان یافته اند استفاده می كند. یك كلاستر گروهی از كامپیوتر هایی است كه بهم پیوسته اند تا سیستمی قوی هیكل را ایجاد كنند. بجای استفاده از سرورهای عجیب و غریب همراه با هشت پردازنده یا بیشتر، گوگل عموماً از سرورهایی استفاده می كند كه دارای دو پردازنده اند، كه نمونة آن ها را می توانید دركامپیوتر های خانگی پیدا كنید.
بواسطة تغییرات اختصاصی به لینوكس ودیگر ابداعات مهندسین، گوگل توانسته است از كامپوننت های ارزان كه فراوان اند عملكرد یك سوپر كامپیوتر را بدست آورد. جدول زیر داده هایی را از سال 2002 در مورد سرعت گوگل در خواندن داده، از هارد درایوها تهیه كرده است.[13]
كلاستر | A | B |
نرخ خواندن (آخرین دقیقه) | 583 MB/S | 380 MB/S |
نرخ خواندن (آخرین ساعت) | 562 MB/S | 384 MB/S |
نرخ خواندن (از زمان شروع بكار مجدد) | 589 MB/S | 49 MB/S |
نرخ نوشتن (آخرین دقیقه) | 1 MB/S | 101 MB/S |
نرخ نوشتن (آخرین ساعت) | 2 MB/S | 117 MB/S |
نرخ نوشتن (از زمان شروع بكار مجدد) | 25 MB/S | 13 MB/S |
این داده ها نتایج عملكرد و كلاستررا نشان می دهند. توان عملیاتی خواندن گوگل از سال 2002 آورده شده است. بر اساس افزایش توان عملیاتی درایو مناسب، ممكن است نرخ خواندن گوگل به 2000 مگابایت درثانیه نزدیك باشد.
برای قرار دادن این داده ها درمفاد تكنولوژی سال 2002 ، بایدوسیلة ذخیره سازی EXP3 شركت IBM كه درسال2002 موجود بوده ومی توانسته داده ها را در حالت انفجار و در نرخ حدود 58 مگابایت در ثانیه بخواند را نیز در نظر گرفت. نرخ خواندن گوگل درسال 2002،بطور میانگین ده برابر نرخ خواندن IBM EXP بوده است، اما نرخ نوشتن آن قابل مقایسه با IBM EXP می باشد. قیمت یك IBM EXP تكی در سال 2002، برای360 گیگابایت فضای ذخیره سازی بدون كنترلها و كابلها در حدود 18000 دلار بوده است. اما قیمت گوگل برای مقایسة فضای ذخیره سازی و عملكرد بالا، در حدود 1000 دلار است. برای سرعت بیشتر ، گوگل كمی بیشتر هزینه می كرد.
دردنیایی كه همواره خواستار افزایش سرعت وافزایش فضای ذخیره سازی هستیم، دراین باره گوگل یكی از موارد موثر و قوی را داراست.[14] پیشرفت در وسایل ذخیره سازی مناسب برای عملكرد بالاتر ، برای گوگل است. گوگل نرخ خواندن داده اش رابروز آوری نكرده، اما مهندسینی كه با گوگل آشنا هستند اعتقاد دارند كه نرخ خواندن داده دربعضی كلاسترها به 2000 مگابایت در ثانیه می رسد. هنگامیكه سخت افزارها بهتر عمل كنند، گوگل بدون پرداخت هزینه ای می تواند سریع تر عمل كند. روش گوگل تمركز روی ساختن نرم افزارهای مهندسی شده كه عملكرد افزون تری حاصل می شوند بوده است. سرعت برای pageRank و دیگر پردازش های تحلیلی گوگل بصورتی قاطع بوده است- اگر توان محاسباتی گوگل كند بود، نمی توانست كارهایی را كه برای شناخت پرس و جوهای مخصوص و مجموعه های مخصوص لازم است را انجام دهد.
گوگل در مورد یكسان بودن وجور بودن كلمات كلیدی كه كاربران در كادر پرس و جو وارد می كردند با اصطلاحات و كلماتی كه در ایندكس گوگل قرار داشت بیفكرانه عمل نكرد. گرچه جور بودن و یكسان بودن اصطلاحات و كلمات كلیدی یكی ازپردازش های خیلی مهم گوگل بحساب می آمد، اما در این مورد نیز حركت گوگل خیلی ماهرانه وبا محاسبات فراوان همراه بود. گوگل داده ها ، امتیازات مختلف یامقادیری از الگوریتم های مشخص را بازبینی می كرد سپس ازاین مقادیر مختلف در دیگر الگوریتم ها برای پیدا كردن نتیجة جستجو، شناسایی بهترین یكسان بودن، خارج كردن كلمات یكسان از Advertising Serverو بروز آوری پیوسته مقادیر هنگامی كه كاربران گوگلبررویلینك ها كلیك می كردند استفاده می كرد. یكبار كه این پرس و جوهای مختلف و پردازش های تعیین كنندة یكسان بودن كلمات كامل شدند، آنگاه گوگل صفحة نتایج رابه كاربر نشان می دهد. اساساً این اعمال دركمتر از یك ثانیه دراین شبكة عمومی اتفاق می افتد. گوگل یك كامپیوتر سریع است كه می تواند دركمتر از نیم ثانیه محاسبات ریاضی پایه ای و اساسی را كه برای اجرای بیشتر نتایج جستجو احتیاج است، نمایش نقشه ها با سرعت یك برنامة كاربردی رومیزی اختصاصی همانند Encarta ، نگاه كردن به صفحة وب مربوط به تطبیق پرس و جوی یك كاربر، اضافه كردن هایپرلینك هایی به محتویات مربوطه قبل از نمایش صفحة نتیجه به كاربر را انجام دهد. Googleplex بصورت آزمایشی حركت كندی داشت؛ وقتی كه این موارد اتفاق افتاد، منابع اضافی رابه حذف كاهش برق اختصاص داد.
سرعت در گوگل دارای معانی زیادی است. سرعت بدین معناست كه كاربران بتوانند با محصولات و سرویس های گوگل اثر متقابل داشته باشند، همانند اینكه برنامه های كاربردی گوگل درحال اجرا بر روی كامپیوتر اختصاصی كاربرباشند. همچنین سرعت به معنای این است كه گوگل بتواند ظرفیت ذخیره سازی ومحاسباتی خود راخیلی سریع افزایش دهد. یكی دیگر از معانی سرعت توسعه و گسترش سریع محصولات جدید است. سرعت همانند توانایی گوگل برای مقیاس گذاری ،یك مركز عاملیت برای Googleplex است.
گوگل تكنولوژی پر سرعت خود را برای جستجو، و انواع دیگر سرورها بكار بوده است. سرورهایی كه از تكنولوژی سریع گوگل استفاده می كننددرجدولزیرنمایشداده شده اند.
نوع | عملكرد |
Advertising Server | اجرای متن و دیگر آگهی های پرداخت شده برای Adwords و Adsense |
Chunkserver | زمانبندی و تحویل پلاكهای داده برای پردازش بیشتر |
Image servers | این سرورها تصاویریبرای Goolgle Image،چاپوسرویس های ویدئویی ارائه میكنند. |
Index server | زحمت جستجو برعهدة آن است. سرور جستجو و بازیابی را بكار می برد |
Mail server | تحویل دادن و اجراكردن سرویس Gmail |
News server | جمع آوری، آنالیز ونمایش اخبار |
Web server | تنظیم نتایج وایجاد آنها برای استفادة كاربران |
تركیب تكنولوژی سریع بعلاوة تعداد انواع داده های گوگل، اجازة انجام چه كاری را به این كمپانی می دهد؟ گوگل می تواند درتوسعة سریع محصولات جدید متعهد شود. بعنوان نمونه می توان به Google Map اشاره نمود كه گوگل یك محصول نقشه برداری اساسی را در مدت سال 2004 توسعه داد ودر اواخر سال 2004، Keyhole را خریداری نمود. در30 ژوئن سال 2005 گوگل دارای موارد زیر بود:
1- انتشار یك محصول نقشه برداری اساسی
2- اطلاعات یكپارچه ای از گوگل محلی در اوایل سال 2005
3- نمایش مصور ماهوارة Hooked Keyhole درون سرویسنقشة گوگلبنام Google Map در اوایل ماه می سال 2005.
4- اعلام سرویس جدید گوگل درمورد زمین بنام Google Earth درماه می سال 2005.
5- بروز آوری سیستم برای جمع آوری دو بعدی نقطه به نقطة تصاویر ماهواره در بالای مسیر.
6- نمایش و اثبات تابعی كه پرس و جویی را درزبانی دیگر پذیرفته ونتایج را به زبان كاربر منتقل می كند و داده ها را در حالتی درختی نمایش می دهد.
تصویر زیر نمایش می دهد كه نقشه گوگل و سرویس زمین، توابع آنلاین نقشه و مجتمع سازی داده ها را به سطح دیگری می برد. در مدت چندین روز، گوگل تكنولوژی Keyhole راكامل كرد، آن را راه انداخت و آغاز نمود، بروز آوری كرد و سرویس های نقشه برداری آنلاین را دوباره تعریف نمود.[15]
شكل 3-5: نمایش كاربرد سرویس نقشه و زمین در گوگل
این نتیجة پرس و جوی سرویس های نقشه وزمین گوگل به زبان ژاپنی برای تعیین محل رستوران Wendey در شهر نیویورك است. افزایش پشتیبانی زبان ژاپنی، دید سه بعدی قسمت مانهاتان جایی كه كاربر مسیرها و یكپارچگی هات لینك ها، نقشة دو بعدی واطلاعات مربوط به رستوران را می خواهد ، بخش آغازین چرخة سریع گوگل می باشد. افزایش امكانات برنامة طراحی شده برای مغلوب كردن مایكروسافت در بازار تجاری بود.
یكی دیگر از عقاید كلیدی در مورد سرعت در گوگل ، وابستگی نوشتن برنامه های كامپیوتری درگسترش كاربران گوگل است. گوگل راههای میان بریرابرای برنامه نویسی توسعه داده است بعنوان مثال گوگل كتابخانه ای از توابع از پیش ساخته شده، برای راحت تر شدن كار برنامه نویس برای بهینه سازی یك برنامه برای اجراء بر روی كامپیوتر Googleplex ساخته است.
در مایكروسافت یا یاهو برنامه نویس باید مقداری كد بنویسد، یا اینكه با این كدها ور رود تا قسمت های مختلف یك برنامه كه باید بصورت همزمان برروی چندین ریز پردازنده اجرا شوند را بدست آورد، اما درگوگل به این صورت نمی باشد. یك برنامه نویس با استفاده از تابعی از روال هایی كه گوگل آنها را بصورت دسته بندی در آورده برنامه ای می نویسد و به Googleplex اجازه می دهد تا جزئیات را دستكاری كرده و جابجا كند. برنامه نویسان گوگل از بیشتر یكنواختی هایی كه به نوشتن نرم افزار برای كامپیوتر های موازی و توزیع شده ربط دارد آزاد هستند.
افزایش بازدهی برنامه نویس به چه معناست؟ با استفاده از امكانات مالی گوگل مهندسی خود را جلوتر برده است بعنوان مثال، اگر یك برنامهنویس خودبهتنهاییبتواند 10 در صد از زمانی را كه برای نوشتن كد یك برنامه احتیاج است كاهش دهد پس انداز او می تواند چندین هزار دلار باشد و اگر یك برنامه نویس بتواند نیمی از زمان كدنویسی را كاهش دهد گوگل پتانسیل بازدهیای خارج از سه هزار برنامه نویسش بدست می آورد.[16]
بعضی از سرمایه گذاران خوش شانس خیلی زود سوار بر عرابة گوگل شدند. با وجود این ، گوگل تا حدی با طراحی كردن و تا حدی با نیازمندی و تنگدستی مقتصد و میانه رو بود. تمركز رویصرفهجوییتاثیرزیادی برتصمیماتكمپانیدرمهندسی نرم افزار و سخت افزار داشت. نكته ای كه در اینجا قابل بیان است آن است كه مصرف پول بطور عاقلانه به معنای كم پولی نیست. در زیر مثال هایی از اینكه گوگل چطور مخارج سیستم های معین را كاهش می داد و یا حذف می كرد آورده شده است:
· گوگل هزینه های مرتبط با پشتیبان گیری و بازگرداندن داده ها را هنگامی كه سخت افزارها دچار مشكل می شدند ویا از كار می افتادند حذف نمود. گوگل عمدتاً احتیاج داشت تا داده ها را سه تا شش بار درجاهای دیگر در Googleplex كپی كند . هنگامی كه یك قطعه از كار می افتاد، Master server برای انجام یك وظیفه ، در فایلی كه می گفت دیگر كپی های داده و برنامه ها كجا هستند نگاه می كرد، سپس از آن داده ها یا پردازش ها برای تكمیل وظیفه استفاده می نمود. نه نیروی انسانی، نه نوار و نه مدت زمان از كار افتادگی آن قطعه مداخله ای در انجام این اعمال نداشتند؛ گوگل این هزینه های قابل پرداخت را به شم مهندسی خود نمی داد.
· گوگل تضمینی برای سخت افزارهای جدید نداشت. هنگامیكه وسیلة ذخیره سازی اضافی یا ظرفیت محاسباتی نیاز بود، تكنسین های گوگل یك رك یا رك های بیشتری را از pizza box های گوگل فراهم می كردند. یكبار دیگر در، به همان صورتی كه ، هنگامی كه كاربر ماوس USB خود را به Laptop متصل می كند و Laptop از این امر مطلع میشود، Googleplex نیز منابع جدید را به همان صورت تشخیص می دهد، سپس مهندسین گوگل منابع را وصل می كنند وبه Googleplex اجازه می دهند تا وظایف دیگر را بكار برد.
· نوآوری های گوگل با استفاده از كدهای باز متن بعنوان یك نقطة شروع بحساب می آید. تعداد بسیاری زیادی از تكنیك های پیشرفته و قابل توجه گوگل، بر مبنای اصلاح نرم افزار بازمین برای كسب سود از بینش بدست آمده از نتایج آزمایش در محاسبات عظیم است. گوگل در حیطة شناخت تنگنا ها در بعضی سیستم عامل های تجاری فعالیت نمی كند. برخلاف مایكروسافت ، گوگل یك سیستم عامل كامل برای Googleplex خود ننوشته است بلكه گوگل تغییراتی كلیدی در لینوكس اعمال نمود و سرویس های لازم و توابعی كه جزو احتیاجات ضروری برنامه های كاربردی است را به آن اضافه كرد. رویكرد گوگل بصورت واقع گرایانه و عمل گرایانه است وزمان كمتری را نسبت به مایكروسافت مصرف می كند. درمقایسه با یاهو، رویكرد گوگل بیشتر بهم پیوسته است. یاهو كار پر زحمت را بعنوان نتیجة سیستم های چند گانه و سخت افزار و دادة غیر یكنواخت می داند . گوگلازلینوكس، استانداردهاونرم افزارهای بازمتن تقریباً بری همة سرویس های مركزی استفاده كرده است تا بدین گونه زمان با ارزش كمتری را صرف سیستم های مجزا وداده های درون یك نمونة استاندارد كند.[17]
· گوگل برای وسایلی با عملكرد بالاهزینه ای مصرف نمی كند تا سیستم هایش را سریع تر نماید. برای روشن ساختن بازده مالی از استفادة مناسب سخت افزار ، مهندسین گوگل یك برآورد هزینه كرده اند. گرچه این برآورد تاریخ دار است اما تاكیدی بر رویكرد اقتصادی گوگل است:[18]
مزایای هزینة استفاده از كلاسترهای ارزان مبتنی بر كامپیوترهای شخصی بر روی گرانترین سرور های چند پردازنده ای می تواند دست كم برای برنامه های كاربردی باقابلیت موازی بودن بالا كاملاً قابل توجه باشد. برای مثال یك رك دویست و هفتاد و هشت هزار دلاری شامل صدو هفتاد و شش CPV ی دو گیگا هرتزی Xeon ، صدو هفتاد وشش گیگابایت حافظه و هفت ترابایت فضای ذخیره سازی است. در مقایسه، یك نمونه سرور مبتنی بر X89 شامل هشت cpu ی دو گیگا هرتزی Xeon، شصت و چهار گیگا بایت حافظه و هشت ترابایت فضای ذخیره سازی است ك قیمت آن در حدود هفتصد و پنجاه و هشت هزار دلاراست . بعبارت دیگر یك سرور چند پردازنده ای در حدود سه برابر گرانتر اما بیست ودو بار CPVهای آن و سه بار حافظة آن كمتر، اما فضای ذخیره سازی آن كمی بیشتر است. بیشتر تفاوت قیمت ها ناشی از پهنای باند بهم پیوستة بالاتر و قابلیت اعتماد سرورهای گرانتر است اما با این وجود ، معماری بالای گوگل به این خصوصیات اعتماد نكرد.
این بدین معناست كه ، زمانیكه مایكروسافت یا یاهو3.00 دلار آمریكا را برای عملكرد بهتر صرف می كنند، گوگل كمتر اط 1.00 دلار آمریكا هزینه می كند.[19] بار دیگر ، رقبای دیگری همچون IBM ، مایكروسافت یا یاهو، ممكن است خصوصیات مشابهی را درون سرویس های مركزی شبكه شان پیاده سازی كنند. اگر بتوان داده های سال 2002 را قبول كرد، گوگل 3/1 بیشتر از كمپانی هایی كه هزینه ای صرف معماری های سرورهای قدیمی كرده اند، برای محاسبات بزرگ خود هزینه كرده است.
مهندسین گوگل مقادیر عظیمی از اطلاعات تكنیكی را تولید می كنند، كه بعضی از این داده ها در فرمی محفوظ و ثبت شده قرار دارند واغلب بصورتی نوشته شده اند كه انتقال اطلاعات عناصر ثبت شده به خواننده ، بصورت كمی انجام میشود. علایق نشریه های گوگل می تواند بصورت ناگهانی تغییر پیدا كند.[20] پیدا كردن اطلاعات شرح حال مدیران گوگل و اطلاعات مربوط به وبلاگ های گوگل می توانند اطلاعات تكنیكی مفیدی را منجر شوند. برای مثال یكی از شرح حالهای گوگل می تواند بیشتر از سی و شش پروژة شخصی كه شامل یكی از CEO های گوگل است را شامل شود.[21] بطور شگفت آوری موتور جستجوی گوگل، كارفهرست سازی اطلاعات تكنیكی كه خود مالك آنها بود را گاهی بصورتی موفق و گاهی مغلوب انجام می داد . در وب سایت های گوگل می توان اطلاعات مهندسی مفیدی را مشاهده نمود. موضوعات دررسالات مختلف ، كتابهای سفید ومتن های تكنیكی كه محدودة وسیعی از موضوعات را شامل می شوند پوشش می دهند. برای مثال در اواسط سال 2005 ، مقالات و روزنامه هایی وجود داشتند كه شامل موضوعات الگوریتم ها ، بهینه سازی كامپایلرها، بازیابی اطلاعات، هوش مصنوعی، طراحیسیستمفایل ، الگوریتمهایژنیتكی، مهندسینرم افزار و طراحی ، سیستم های عامل و سیستم های توزیع شده و موضوعات دیگری بودند. گوگل در مورد استفاده از حجم عظیمی از فایل ها و اینكه چطور نسخه ای از لینوكس را اصلاح كرده كه بصورت خود كار كارها را تعیین می كند واز تنگناهای سیستم فایل دوریمینمایدكهمیتواندباعثمختل شدن solavis و Windows Advanced Server 2003 باشد توضیح داد.
مقالات تكنیكی و امتیاز نامة گوگل برخی بینش ها را درون مكانهای جالب گوگل تهیه می كند بعنوان مثال می توان به این مورد اشاره كرد كه گوگل در حال مطلع ساختن اطلاعات بیشتری در مورد سیستم های عامل و برنامه های كاربردی است. فشار نوآوری های گوگل برا ی ساخت پلتفورم جستجو و گسترش فعالیت برنامه های backoffice ی است ، كه در سرویس های تبلیغاتی از آن استفاده می كنند.
پیوست به این رساله اطلاعاتی را در حدود بیشتر از شصت حق ثبت و امتیاز نامه را فراهم می كند تا گوگل باور كند. كه یك مباشراست. برای تهیة اطلاعات ریزتر به تكنولوژی گوگل نگاه كنید، جدول زیر مثال هایی از ابداعات ثبت شده بوسیلة مهندسین گوگل ویا تحقیقات نزدیك كمپانی در آن مورد را نشان می دهد. بیشتر این مقالات ، از پیش برای دریافت امتیاز نامة گوگل برای تكنولوژی، در این گزارشها ارجاع شده است.
جدول 3-4: نمونه هایی از ابداعات ثبت شده توسط مهندسین گوگل
تكنولوژی | هدف | برای یادگیری بیشتر |
پیشنهاد گوگل | با آنالیز كردن پرس و جوها و پیشنهاد كردن دیگر پرس و جوها به كاربران ، به یافتن اطلاعات مورد نیاز كمك می كند. | Services computing, 2004 IEEE International Conference on (scc,04) by Stephen Davies, serdar Badem, Michael D,Williams, Roger king september 2004 |
جستجوی شیهای ویدئویی | كاربران نام یك شی راتایپ می كنند و سپس گوگل آن شی را درویدئو پیدا می كند | Ninth IEEE International Conference on computer vision volume 2 yosef sivic, Andrew Zisserman Publication Date; october 2003 |
MapReduce | تابع جدیدی در Google Linux برای سرعت بخشیدن به برنامه نویس ودیگر پردازش هایی كه شامل محموعة بزرگی از داده هاست. | OSDI proceeding, December 2004. |
فایل سیستم گوگل | توسعة Google Linux ، تا خواندن داده ها با سرعت بالا و نوشتن آنها از درایوهای مناسب را امكان پذیرد سازد. | ACM Publication 1-58113-757-5/03/0010 |
شناخت میزان منابعدر محتویات وب | استفاده از الگوهای كوچك برای تولید مقداری عددی كه یك منبع معتبر را بعنوان دلیل كیفیت محتوا نشان دهد. | Seventh International Database Engineering and Applications symposium (IDEAS, 03) Haofengzhou, Yubo Lou, Qingqing Yuan, Wilfred Ng. Wei Wang, Baile shi julay 2003 |
متاكریستال | تكنولوژی Metasearch به یك پرس و جوی تكی اجازه می دهد تا بتواند نتایج را در یك فرم بصری قابل نمایش بازیابی كرده و سازمان دهد. | Second International Conference on Coordinated Muliple Views in Exploratory Visualization (CMV,04) Anselm spoerri july 2004 |
3-10:اشكالات Googleplex
در آیین هندوها ضرب المثلی وجود دارد كه می گوید: «نابرده رنج گنج میسرنمیشود» این ضرب المثل در مورد گوگل نیز درست است. گوگل اشتباهات زیادی داشته است وبعضی مواقع این اشتباهات از نوع بزرگ بوده اند. بعنوان یك مثال جدید كه در عنوان خبرها قرار داشت، می توان به تسریع كنندة وب اشاره نمود. این محصول در ماه می سال 2005 معرفی شد و كمتر از شش هفته بعد، از آن صرف نظر شد. سرعت و چابكی بكنار ، تسریع كنندة وب تكنولوژی بود كه مستقیماً درون مسأله اجرا می شد و نتیجة بزرگتر ، كندسازی نوبتی و دوره ای برای Gmail بود. Googleplex صعود پذیر است اما تا زمانیكه بیشتر سرورها آنلاین باشند ممكن است كاربران با تاخیرات آزار دهنده روبرو شوند.
نرم افزار تسریع كنندةوب برای استفادة سرورهای گوگل برای ذخیرة صفحات وبی كه كاربر مشاهده می كرد فرض شده بود. تسریع كنندة وب یك صفحه در مرورگر كاربر را تجزیه می كرد، بعد از آن، تابع تسریع كنندة وب هر لینك بر روی صفحة جاری را دنبال می كرد و در نهایت صفحه درcache گوگل ذخیره می شد . هنگامیكه كاربر بر روی لینكی كلیك می كرد صفحه را از cache گوگل می دید، بنابر این مدت زمانی كه طول می كشید تا صفحه ای به كاربر نمایش داده شود كاهش پیدا كرد.
تسریع كنندة وب بر روی سایت هایی كه كمترین استفاده از سرویس های حرفه ای وب را داشتند همانند www.whitehouse. gov به خوبی عمل می كرد. متأسفانه تابع تسریع كنندة وب از لینك هایی كه دستورالعملها را به برنامههای كاربردی وب منتقل می كردند پیروی می كرد. بعنوان مثال تسریع كنندة وب می خواست بر روی لینك های “delete” كلیك كند كه همین امر سبب می شد بعضی برنامه های كاربردی مانند BackPack اجرا شده و محتویات كاربر را پاك نماید[22] تسریع كنندة وب از تاییدیه هایی كه توسط جاوااسكریپت صادر می ش بخوبی چشم پوشی می كرد بنابراین همین عامل باعث صدور دستوراتی غیر عمدی می شد. بعضی از صاحبنظران گوگل سوالاتی را در مورد caching داده ها بعلاوة امنیت و كپی رایت آنها مطرح كردند اما قبل از اینكه این مسأله به اوج خود برسد گوگل گزارشی مبنی بر اینكه ظرفیت تسریع كنندة وب كامل شده بیان كرد و به همین خاطر دانلود این محصول را مسدود نمود.
با استفاده از اطلاعات موجود در وبلاگ ها و صحبت هایی كه در كنفرانس ها شده است می توان اطلاعاتی راجع به تعداد سرورهایی كه گوگل استفاده می كند بدست آورد البته لازم به ذكر است كه گوگل تعداد سرورهایی را كه استفاده می نماید افشا نمی كند، اما این تعداد در تاریخ 30 ژوئن سال 2005 بین 150000 تا 170000 سرور بوده است . گوگل بسرعت تعداد مراكز دادة خود را گسترش داد بعنوان مثال مركز دادة نزدیك به آتالانتا وجورجیا یكی از جدید ترین مراكز گسترش یافتة گوگل است. مهندسین گوگل مطابق آخرین پیشرفت های علمی آنچه را كه در مورد گرما وتوان آموخته بودند در مراكز داده ای خود بكار بردند. در 12 ماه گذشته، گوگل تمركز سرورهایش را كه در حدود یك دوجین مركز داده كه هر كدام همراه با 10000 سرور یا بیشتر بوده اند را به حدود 60 مركز داده كه هر كدام تعداد ماشین های كمتری در آنهاست تغییر داده است[23] این تغییرات جوابی است برای گرما و توان منتشر شده كه مربوط است به سرورهای تمركز یافتة بزرگتر گوگل.
بیشترین اجزایی كه مستعد در نقص بودند عبارتند از:
· فن ها
· IDE درایوها، كه در نرخ یك در هزار درایو، در هر روز از كار می افتادند.
· منابع تغذیه كه در نرخ پایین تر عمل نمی كردند
تعمیرات، خود بعنوان عملیاتی مجموعه ای است . زمان بندی برنامةتعمیرات خود یك شغل بزرگ است و كاركردن در آن زمینه باعث پیشرفت توانایی برنامه ریزی برای توسعة گوگل می باشد. گوگل باید میزبانهایی را مكان یابی كند كه بتوانند احتیاجات توان و گرمای كمپانی را پاسخ دهند.
مراكز دادة گوگل به خطوط چندگانه با سرعت بالا وتابع های مركز دادة نرمال از قبیل توان زیادی ، راههای عبور و مرور و قوانین مشخص كه دستیابی به جعبه های فیزیكی را ممكن می سازند دستیابی دارند. وبلاگ Rweaver شامل عكسی است كه بقولی از درون یك مركز دادة گوگل گرفته شده است. اگر این عكس درست باشد لایه های فیزیكی رك ها در حدود 2000 سرور ویا بیشتر را كه بصورت مقدار عظیمی سخت افزار فشرده درفضای بستة محكمی قرار گرفته اند را نگهداری می كند.
شكل 3-6: نمایی از درون یك مركز دادة گوگل
این نوع پیكربندی متراكم كمك می كند تا بتوان به تفسیر در مورد اهمیت گرما و توان توضیح داد. بیشتر مراكز داده ای برای مدیریت متمركز هزارها سرور طراحی نشده اند. گرما باعث میشود هارد درایوها درست كار نكنند و دچار نقص شوند. از طرفی، پیكربندی متراكم ، تنظیم كردن، نگهداری و تعمیر را تاحدی آسان تر می كند. البته نكته ای كه در اینجا باید گفت آن است كه گوگل سرورها را در دو سمت رَك متراكم كرده و قرار می دهد. یك خصوصیت منحصر بفرد مراكز داده آن است كه می توان محتویات را از یك مركز داده به مركز دادة دیگر كپی نمود. داده های گوگل كه درون مراكز داده قرار گرفته اند بر روی دیگر سرورها و كلاسترهای در حال اجرا در رَك ها كپی شده اند. فلسفة مهندسی “Plug and play" گوگل نشان می دهد كه می توان از آن درون و در سر تا سر مراكز داده استفاده كرد. اگر یك مركز داده همانند همین مركز داده كه در بالا نشان داده شده احتیاج به ظرفیت اضافی ایندكس سرور داشت، تكنسین ها در آن مركز می توانند یك رَك گوگل چهل جعبه ای سرور بسازند كه این سرورها نیز به شبكه متصل اند. هنگامی كه رَك روشن شد قابل استفاده و دسترس برای master server ها آن مركز داده است سپس این master server ها منابع رَك ها را در صورت قابل استفاده بودن علامت گذاری كرده و شروع به فرستادن كار به وسایل جدید می كنند.
اطلاعات مربوط به مراكز داده ها نشان می دهند كه این “Plug and play" مفهوم و كشف اتوماتیك منابع جدید ذخیره شده در مراكز جدید داده هاست نه فقط رَك ها با محتویات داخلشان شاید اغراق باشد اگر بگوییم Google رَك ها و مراكز داده در جایی كه رَك قرار دارد همانند یك ماوس USB كار می كنند. در مفهوم كلی بنظر می رسد مهندسین گوگل تلاش كرده اند تا آنچه را كه می خواهند بدست آورند.
یك مهندس گوگل می گوید هر جایی كه ما یك كلاستر قرار دهیم، گرما، خنك كننده وتوان پیامد آن خواهد بود. هنگامیكه ما آن را در یك مركز داده قرار می دهیم عملكرد مركز داده با چالش های جدیدی روبرو خواهد شد. ما هر روز چهار مگاوات برق مصرف میكنیم.
مشكلات شامل موارد زیر هستند:
1- گرما. رَك های مخصوص همراه با فن كه مركز آنها را خنك می كند استفاده میشود.
2- توان (برق) . برقی كه در هنگام بارگذاری نیاز است خیلی بیشتر از برقی است كه اساساً مراكز داده ها متحمل می شوند. مهندس ارشد گوگل جف دین می گفت: «قفسهای ما سفارشی ساخته شده اند و قبل از اینكه ما بتوانیم كلیدی را بزنیم كارهای از قبل انجام شده ای وجود دارند كه بوسیلة ما ودیگر افراد مركز داده انجام شده اند.»
3- ابزار مدیریت شبكه . گوگل باید برای مدیریت درمان خودكار و همچنین كشف خطاهای سیستم عامل بصورت اتوماتیك ابزار مدیریت شبكه را ایجاد كند.
3-14:Sergey چیست؟
مراكز دادة گوگل در آمریكای شمالی همراه با دیگر مراكز داده كه در سوئیس، سرزمین های كرانة اقیانوس آرام و پكن قرار دارند تمركز یافته اند.[24]
بخاطر اینكه GOS بصورتی است كه خودش را درمان كرده و خطاهای خودش را پیدا میكند سیستم عامل و master كامپیوتر های مختلف موجود در یك كلاستر می دانند چه وسیله ای آنلاین است و كار می كند و چه وسیله ای از كار افتاده است. ابزارهای مدیریت شبكه كه بصورت كالاهای آماده هستند در خور احتیاجات گوگل نمی باشند. بنابراین گوگل در حال توسعة ابزارهای مدیریت و نظارت شبكه است واطلاعات موجود در log فایل های سیستم عاملِ گوگل، می تواند در یك روش معنی دار برای مهندسین شبكة گوگل نمایش یابد.
سرتاسر Googleplex كار می كند و به كار كردن خود ادامه می دهد حتی اگر یك وسیله، رَك یا مركز داده بسته شود ویا از بین برود. ابزارهای مدیریت شبكه باید یك محدودة وسیع از نظارت و پشتیبانی عملكرد شبكه های جهانی، وسایل ، جریان داده ها، بارگذاری كارها و مشكلات پتانسیل ناحیه ها را تامین كند. گوگل در حال توسعة ابزارهای مورد نیاز برای مدیریت شبكه مخصوصاً Googleplex است.
3-15:پیش بینی نكردن نقص ها می تواند نیروی مخرب گوگل را از خط خارج كند.
شبكة گوگل از یكسری عقاید كه در حاشیة نوآوری های كامپیوتر وجود دارد بعلاوة یكسری دانسته هایی كه از خود Googleplex بدست آورده استفاده می كند. نتیجه ، یك شبكه با عكس العمل بالاست كه ممكن است همین شبكه مشكلاتی را بپروراند كه قبلاً با آنها برخورد نكرده بوده است. گرچه گوگل بیشتر از پنج سال است كه بدون مدت از كارافتادگی از نقص سیستم ها كار می كند. اما احتمال اینكه چیزی غیر قابل پیش بینی اتفاق بیفتد نیز وجود دارد. یك مشكل بزرگ كافی است تا ضربة سختی را به گوگل وارد كند. تكنولوژی پیشرفتة ابزار MapReduce گوگل و همچنین چهار صد ماژول كتابخانة آن می تواند در برابر مشكلات تكنیكی پیش بینی نشده قرار گیرد.
شكل 3-7: نمایی از حركت گوگل به جلو برای رفع تنگناهای ایجاد شده
شكل بالا كه بوسیلة مهندسین گوگل تهیه شده است نشان می دهد كه چطور حركت گوگل به سمت جلو تنگناهای ایجاد شده در سیستم های موازی كه بوسیلة رفت و آمد بیش از اندازة پیغام ها از طریق یك سرور كه كار را در میان كامپیوتر های مختلف هماهنگ می كند رفع میشود.
منتقدان گوگل می توانند به سه مشكلی كه در رسیدن گوگل به سطح كارایی و عملكردش است اشاره كنند.
اولین مشكل: گوگل یك حقةكوچك است . تغییر به لینوكس ودیگر تكنیك های اصلاح كننده، كمی بیشتر از سعی هكرها برای له كردن عملكرد كوچك بدست آمده است.
دومین مشكل: گوگل از سخت افزار مناسب و رسانة ذخیره سازی ارزان استفاده می كند كه این راه حل. خود یك ریسك بشمار می رود. هنگامی كه در سیستم هایی كه كاری به آنها محول شده است كامپوننت های ارزان استفاده می شوند ممكن است مشكلاتی نامعلوم كمین كرده باشند. افزایش این دیسك های بالقوه است كه گوگل را وادار می كند تا تغییراتی را برای تسریع اجرای برنامه ها ایجاد كند.
نهایتاً، دیگر سیستم های عملیاتی از آنهایی كه در لابراتورهای تحقیق كامپیوتر هستند تا مایكروسافت برای سالهاست كه اعمال یكسانی را انجام می دهند.
3-17:اهرم بندی Googleplex
گوگل نشان داده است كه جستجو تنها یك برنامة كاربردی است كه می توان آن را در محیط گوگل اجرا كرد. برنامههای كاربردی زیاد دیگری وجود دارند كه می توانند از حركت گوگل به سمت سرویس های آنلاین سودمند باشند:
1- برنامه های كاربردی كه به مبلغ عملكرد بالا برای اجرا با بهای كم احتیاج دارند مانند پست الكترونیكی
2- برنامه های كاربردی كه می توان در محیط اضافی گوگل جایی كه پاسخ گویی بصورت خصوصی نباشد اجرا كرد، كه می توان همانند این برنامة كاربردی را درمحیط عملیاتی 400/AS شركت IBM یافت.
3- برنامه های كاربردی محاسباتی- فشرده و بدون تابعیت
4- برنامه های كاربردی كه احتیاج به برابری سطح درخواست دارند، یك مشخصة قابل استفاده با اجرای منحصر بفرد در خواست ها بر روی سرورهای جدا مانند
Google Earth است.
كاربر صحبت هایش را با خودش تمرین می كند و می گوید كمی مانده تا بوسیلة یورتمههای اسب های جنگی، گوگل را لگدمال كنیم و از این طریق سودی بدست آوریم. گوگل به سمت كارهای محاسباتی توزیع شدة موازی- بزرگ، حتی بر روی شبكه های dial-up حركت می كند.
گوگل انواع افكار مرتبط كوچك كمپانی های ركاب دار- نقدی همراه با تكنیك هایی از سیستم های كامپیوتری پیشرفته را تركیب می كند. محصولات مناسب، قیمت خود را پایین نگه داشته اند. لینوكس اصلاح شده عملكرد سریعی را در ارزش وبهای زیرین معامله و داد و ستد دارد. اكنون گوگل درحال اتخاذ یك ریسك استراتژیك است كه با سخت افزار مناسب ویكی از نسخه های لینوكس می خواهد آن را انجام دهد. یكی دیگر از نقاطی كه قابل توجه است آن است كه هر روزه گوگل شرط بندی می كند كه تكنولوژی كه او استفاده می نماید می تواند سیستم را پر فعالیت نگه دارد.
دلیل دیگر برای اینكه چرا رسیدن گوگل به تكنولوژی بصورت منفعتی است آن است كه كارمندان گوگل فلسفة عملی یكسان و استعدادهایی در زمینة توسعة برنامه های كاربردی دارند. گوگل از تمرینات استاندارد مهندسی، دانسته های اختصاصی و از تكنیك های آمادة مصرف همانند استفاده از سرویس های وب استفاده می كند. همچنین نكتة دیگری كه قابل ذكر است آن است كه گوگل از تكنیك های یكسانی در زمینة وب استفاده می كند كه میلیون ها توسعه دهندة وب از آن تكنیك استفاده می نمایند. بازدهی برای گوگل خیلی راحت است بدین صورت كه گوگل افرادی را كه قادر به نوشتن كد برای Googleplex هستند را بكار گرفته و آن ها را كرایه می كند سپس مزد آنها را پس از نوشتن كد مورد نظر پرداخت می نماید. اما نكتة جالب آنجاست كه گوگل برای برنامه های بازاریابی توسعه دهندگان پولی صرف نمی كند. بزرگترین ترقی برای حركت گوگل آن است كه رقبای او بصورت های زیر متفاوت اند وبیشتر بسوی حركت های گران تمایل دارند.یاهو كیكی است میوه ای از سخت افزار، سیستم های عامل و برنامه های كاربردی كه كدهای آنها درزمان های مختلف ، درزبان های مختلف وبوسیلة افراد مختلف نوشته شده است. مایكروسافت نیز از سیستم عامل خودش استفاده می كنداما بر سیستم عامل های دیگری نظیر Solaris نیز متكی است. مایكروسافت باید در زمینة سخت افزار سرمایه گذاری كند تا خارج از پلتفورم خود عملكرد را تخت فشار قرار دهد. یاهو با پلتفورم های مختلف دست به گریبان است . بنظر می رسد مایكروسافت بدون وارد كردن زور، سرعت سیستمعامل خودش را بالا برده است. در هر حال هر دوی آنها شتر مرغ های دیجیتالی هستند كه سر خود را در بازارهای اطلاعاتی و ماده ای خود دفن كرده اند.
تكنولوژی گوگل یك رقیب بزرگ برای مایكروسافت ویاهو بحساب می آید. بنابر این برای نتیجه گرفتن، نگاهی كنید به تكنولوژی گوگل كه شامل این بخش هاست.
1- گوگل در هر جایی از دنیا سریع است
2- دانسته های گوگل. هنگامی كه مشكلات برق و گرما درسطح انبوهی از مراكز داده ای گوگل اتفاق افتاد، گوگل سیستم خنك كننده و قدرت نگهداری و حفاظت را ابداع نمود و از آن برای دو جین از مراكز داده اش استفاده كرد.
3- برنامه نویسانی كه می خواهند در گوگل كار كنند. «گوگل به این امر رضایت داد» و گفت: فارغ التحصیلان یكی از دانشگاههای اخیر واشنگتن می توانند بعنوان برنامهنویس در گوگل كار كنند.
4- عملیات گوگل و سنجش هزینه ها بسیار پائین تر از دیگر شركت های تجاری مشابه است
5- گوگل به برنامه نویسان و مهندسان طراح فشار شدیدی را برای كاركردن وارد میكند
6- از سال 2000 سقوط ناگهانی ویا آسیب دیدن برای گوگل اتفاق نیفتاد یا اقلاً بصورت آنلاین بسر نمی برد.
7- Googleplex گوگل اكنون می تواند برنامه های كاربردی دسكتاپ – سرور را اجرا نماید.
8- نصب وبروز آوری برنامه های كاربردی گوگل بدون دیگری كاربر با جزئیات فراوان انجام میشود.
9- امتیاز نامة گوگل، بینش تكنولوژی اساسی وابسته به عملكرد هستة گوگل را فراهم می كند.
یك برنامه نویس جوان در اُزاكا یا پكن به كسب اعتبار در گوگل خیلی امیدوار است. برنامه نویسان ماهر می خواهند برای توسعة Googleplex در گوگل كار كنند و اگر امكان داشته باشد گوگل محشر خود را بسازند، شعار آنها این است:
“Be Like Sergey and Larry" گوگل نسل بعدی پلتفورم های محاسباتی رانیز دارد كه برای اجرای برنامه های كاربردی مجازی به كاربران جهانی ، بهینه سازی شده است. گوگل از تكنولوژی های استاندارد وب در راههای هوشمند استفاده می كند. گر چه نمای رقابت تكنیكی گوگل با دیگر رقیبان سخت و دشوار بنظر می رسد اما این كمپانی هنر محاسبة آنلاین پیشرفته را دارد.
[1] - From “The Anatomy of a Large-Scale Hypertextual Web Search Engine” , WWW. db. Standord . edu/~backrub/google. html
[2] - پیوست این مقاله شامل لیستی از بیش از شصت اختراع به ثبت رسیدة گوگل است. این لیست كاملاً تكمیل نمی باشد، اما به هر حال لیستی از تعداد اختراعات و توضیح خلاصه ای در مورد بعضی از آنها كه مهمتر هستند را در اختیار می گذارد. اختراع ثبت شدةPageRank متعلق به هئیت علمی دانشگاه استنفورد می باشد. اختراعات گوگل سعی می كنند در جهت تمركز بروی سیستم ها و روش هایی برای ارتباطات ، تبلیغات و دیگر فعالیت های شركت حركت كنند.
[3] - جف دین پژوهشگر سابق Alta Vista و مهندس ارشد گوگل از MapReduce طرفداری كرده است. بیشتر مقالات اخیر او در آدرس Http:// labs . google. Com/people/jeff/. موجود می باشند.
[4] - محاسبات شبكه ای درحال بكار بردن منابعی از بسیاری كامپییوتر ها در یك شبكه برای یك مشكل یا یك برنامة كاربردی است. گوگل از تكنولوژی grid-like در سیستم كامپیوتری توزیع شده اش استفاده می كند.
[5] - BitTorrent یك ابزار توزیع فایل همتاست كه به وسیله برنامه نویس برام كوهن در سال 2001 نوشته شده است پیاده سازی مرجع آن به زبان پایتون و تحت گواهینامه MIT است.
[6] - گوگل در هر كجا بین 100000 تا 165000 سرور و یا حتی بیشتر دارد. سرورها درون كلاسترهایی سازماندهی شده اند . كلاسترها ممكن است درون یك رك یا سرتاسر رك های متعدد سرورها قرار داشته باشند. بعضی از توابع گوگل در سرتاسر مراكز داده توزیع شده اند.
[7] - از سخنرانی دكتر دین در دانشگاه واشنگتن دراكتبر سال 2001 . وب سایت
http:// www. uwtv.org/programs/displayevent.asp? rid=2459. را مشاهده كنید.
[8] - پیكاسا احتیاج به دانلود دارد. فرایند نصب برنامه بصورتی ملایم انجام میشود. سرعت ایندكس كردن این برنامه پنج برابر سریع تر از برنامة ACDSee كه یك برنامة مدیریت تصاویر و محصولی رقابتی با پیكاسا است می باشد. تكنولوژیست های گوگل ثابت كردند كه این نرم افزار سریع بوده و دارای نصبی رایگان است. همچنین علاوه بر این دومزیت دارای رابط كاربری مناسب و قوی نیز می باشد.
[9] - See for example Andrea C.Arpaci- Dusseau, et. al . “High performance sorting on network of workstations”. In proceedings of the 1997 ACM SIGMOD International conference on management of Data, Tucson, Arizona, may 1997 or John Bent, et.at.”Explicit control in a Batch- Aware Distributed File system” Both contained in proceedings of the 1at USENIX symposium on Networked systems Design and Implementation. March 2004
[10]- تصویر زیر یك مثلث (سایرپنیكسكی) است، تصویر فوق به این دلیل انتخاب شده است كه این مفهوم را می رساند كه چطور در شالوده گوگل هر جزء تركیبات بزرگتر دیگری از سرورها و مراكز داده را تكرار می كند. سرتاسر ساختار- در این تصویر یك مثلث متساوی الاضلاع است كه پایایی حركت گوگل برای سیستم هایش را بیان می كند. این شكل معروف بر این دلالت دارد كه چطور گوگل بدون تغییر ساختار بزرگ یا كوچك Googleplex ، مقیاس بندی را انجام می دهد.
[11] - مراكزداده از كامپیوتر هایی استفاده میكنند كه شكل آنها شبیه به جعبه هایی است كه برای نگهداری پیتزا استفاده میشود. اصطلاح جعبه های پیتزا بوسیلة مهندسین برای توصیف یك فرم استاندارد برای سرورهایی كه درون رك ها قرار گرفته ودر مراكز داده قرار دارند اختصاص داده شده است.
[12] - جملة مذكور در اكتبر سال 2004 در دانشگاه واشنگتن گفته شده است.
[13] - From “The Google File System “ by Sanjay Ghemawat, Howard Gobioff, and Shun – Tak Leung (Google) ACM SOSP 2003 Conference proceedings 1- 58113-757-5/03/0010, page 12.
[14] - با ابزارهای پیشرفتة برنامه نویسیِ گوگل، گوگل قادر است كه باز دهی مهندسین خود را افزایش دهد. با تركیب سرعت سخت افزار و عملكرد ، گوگل فشار زیادی رابرای بازدهی از طریق بكار بردن استعدادهای مهندسین خود برای توسعة برنامه های كاربردی اعمال می كند. این سه دلیلی است كه رقبای گوگل باید به آنها پاسخ دهند.
[15] - منبع این تصویر سایت http: // blog. eee- craft-com/archives/23345086.html می باشد.
[16] - بعضی از برنامه نویسان گوگل دربارة برابری فشار برای انجام كارشكایت كردند. مدیریت گوگل با چالش های مدیرتیی استعدادهایِ برنامهنویساش برخورد می كند البته نكتة قابل توجه آن است كه فرار كارمندان می تواند منابع تكنیكی گوگل را معیوب سازد.
[17] - گوگل صراحتاً توضیح ندارد كه سرویس های متمایل به معماری را پذیرفته یا SOA را . گرچه بسیاری از تمرینات گوگل استفاده از خصوصیات مشخص SOA را اطلاع می دهد.
[18] - Luiz Andre Barroso, Jeffrey Dean. and Urs Holzle, “Web Search for a planet : The Google cluster Architecture” , IEEE computer society 0272-1732/03, March April 2003
[19] - تخمین در مورد هزینة گوگل نشان می دهد كه ، گوگل مزایای هزینه اش را با یك یا دو دستور العمل اظهار نكرده است. همانقدر كه عملكرد محصولات سخت افزاری بالا می رود، هزینة آن سخت افزار ها نیز كاهش پیدا می كند. گوگل قادر است داده های خود را كپی كرده و گیگا بایت ها فضای پست الكتریكی را بصورت مجانی در اختیار قرار داده و ببخشد.
[20] - به سایت htp:// labs . google . com/ papers. Html قسمت كامپایلوها مربوط به تاریخ 1 ژوئن 2005 مراجعه كنید.
[21] - پروژة /ex به نوشتن برنامه هایی كمك می كند كه كنترل جریان در آنها بصورت مستقیم و همراه با مثالهایی از اصطلاحات با قاعده در جریانهای ورودی است. این پروژه دنبالة خوبی برای انواع انتقالات editor-script و بخش بندی ورودی برای تهیة روال های تجزیه شده می باشد.
[22] - BackPack یك برنامة كاربردی برای وب است كه می تواند محتویات هر صفحه ای را بصورت پست الكترونیك برای كاربر بفرستد
[23] - این داده ها درwww.mcdar.net/SEOTools.htm قابل مشاهده هستند.
[24] - هدف از ایحاد مركز داده در پكن مطابقت احتیاجات انسانی برای دستیابی مستقیم، نظارت و مسائل وابسته بود كه گوگل این مسائل را برای تجارت در چین تنظیم نمود. یاهو .com 3721 را برای آن خرید تا بتواند به تلاش خود در چین سرعت دهد.
این متن فقط قسمتی از تکنولوژی گوگل می باشد
جهت دریافت کل متن ، لطفا آن را خریداری نمایید
قیمت فایل فقط 2,300 تومان
برچسب ها : تکنولوژی گوگل , چگونه گوگل از یاهو و MSN متمایز میشود