Apache Cassandra چیست؟


۲۹ تیر ۱۳۹۹
دیتابیس apache cassandra

Cassandra یک سیستم متن‌باز و توزیع شده برای مدیریت دیتابیس‌ها است که داده‌ها را در ستون‌ها (column) ذخیره می‌کند. همچنین یک سیستم مدیریت دیتابیس‌های NoSQL برای کار کردن با حجم زیادی از داده‌های پخش شده میان چندین سرور (که باعث افزایش دسترسی‌پذیری بدون هیچ گونه عامل خرابی، می‌شود) است. با زبان Java نوشته شده و توسط Apache توسعه داده شده است.

Avinash Lakshman و Prashant Malik در ابتدا Cassandra را در Facebook برای بهبود قابلیت جست‌وجو صندوق ورودی Facebook، توسعه دادند. Facebook پروژه Cassandra را در جولای ۲۰۰۸، به عنوان یک پروژه متن‌باز بر روی Google code منتشر کرد. در مارس ۲۰۰۹ به یک پروژه Apache Incubator و در فوریه ۲۰۱۰ به یک پروژه سطح بالا تبدیل شد. این قابلیت‌های برجسته Cassandra، باعث معروف‌تر شدنش شد.

مسیر توسعه cassandra

Apache Cassandra برای مدیریت حجم زیادی از ساختار داده‌های توزیع شده استفاده می‌شود. در واقع یک سرویس با ثبات بالا و بدون عاملی که باعث خرابی شود (no single point of failure)، است. لیست زیر، برخی از مزیت‌های دیتابیس Apache Cassandra است:

  • مقیاس‌پذیر، دارای قابلیت مدیریت خطا و پایدار است.
  • دیتابیسی براساس ستون‌ها (column-oriented) است.
  • طراحی توزیع شده آن براساس Dynamo آمازون و مدل دیتای آن براساس Big table گوگل است.
  • در Facebook ساخته شده است و به شدت از سیستم‌های مدیریت دیتابیس‌های رابطه‌ای، متفاوت است.

Cassandra مدل Dynamo-style replication را که هیچ عامل خرابی ندارد را پیاده می‌کند، اما مدل داده column family قدرت‌مندتری را به آن اضافه می‌کند. Cassandra توسط شرکت‌های بزرگی نظیر Facebook، Twitter، Cisco، Rackspace، eBay، Netflix و … استفاده می‌شود.

هدف طراحی Cassandra، مدیریت داده‌های حجیم یا Big data، از طریق چندین node یا سرور، بدون هیچ گونه مشکلی است. Cassandra یک سیستم نظیر به نظیر (peer-to-peer) توزیع شده میان nodeهایش دارد و دیتا در میان تمام nodeهای یک کلاستر توزیع شده است.

تمام nodeهای Cassandra که در یک کلاستر قرار دارند، نقش یکسانی را ایفا می‌کنند. هرکدام از nodeها مستقل هستند، در عین حال به nodeهای دیگر نیز متصل شده‌اند. هر کدام از nodeها در یک کلاستر، می‌توانند درخواست‌های خواندن و نوشتن را، بدون توجه به مکان قرارگیری دیتا در این کلاستر، بپذیرند. هنگامی که یک node از دسترس خارج می‌شود، درخواست‌های خواندن و نوشتن توسط سایر nodeها در شبکه مدیریت می‌شوند.

قابلیت‌های دیتابیس Cassandra

Cassandra به دلیل قابلیت‌های فنی که ارائه می‌کند، به سرعت معروف شده است. در زیر به برخی از این قابلیت‌ها می‌پردازیم:

۱) توزیع پذیری آسان داده‌ها:

این قابلیت را فراهم می‌کند که داده‌ها را در هرجایی که بخواهید، توسط تکثیر آن‌ها در مراکز داده مختلف، توزیع کنید. برای مثال: ۵ node در اختیار داریم، بیایید نام‌های آن‌ها را اینگونه تصور کنیم: N1، N2، N3، N4، N5. با استفاده از الگوریتم پارتیشن‌بندی، محدوده توکن را در نظر می‌گیریم و براساس این داده‌ها را توزیع می‌کنیم. هر کدام از nodeها محدوده توکنی را دارد که داده‌ها توسط آن‌ها توزیع می‌شوند (در واقع توکن‌ها در Cassandra، یک مقدار hash هستند که به هنگام افزودن داده به Cassandra ایجاد می‌شوند و هرکدام از nodeها شامل محدوده‌ای از این توکن‌ها می‌شوند). برای فهم بهتر به تصویر زیر نگاهی بیندازید:

 توزیع پذیری آسان داده‌ها cassandra

۲) ذخیره‌سازی انواع داده‌ها:

Cassandra تمام فرمت‌های امکان‌پذیر در داده‌ها را در خود جای داده است، نظیر ساختار یافته، نیمه ساختار یافته و بدون ساختار. در واقع با توجه به نیاز شما، به صورت پویا، ساختار داده را به ساختار مدنظرتان تغییر می‌دهد.

۳) مقیاس‌پذیری:

Cassandra بسیار مقیاس‌پذیر است و این اجازه را می‌دهد که بتوانیم سخت‌افزارهای بیشتری برای استفاده مشتریان و ذخیره‌سازی داده‌های بیشتر، اضافه کنیم.

۴) سرعت بالا در ذخیره سازی:

Cassandra برای اجرا در سخت‌افزارها و یا سرور‌های ارزان قیمت و سطح پایین طراحی شده است. Cassandra می‌تواند به طرز چشمگیری، عملیات نوشتن را با سرعت بالایی اجرا کند، همچنین می‌تواند صدها ترابایت داده را بدون کاهش سرعت خواندن، ذخیره کند.

۵) قابل اطمینان:

Cassandra عاملی ندارد که باعث خرابی و یا پایین آمدن آن شود، پس می‌توان از آن برای برنامه‌های مهم اقتصادی که در آن‌ها عدم خرابی از اهمیت ویژه‌ای برخوردار است، استفاده کرد.

۶) عملکرد خطی سریع:

Cassandra به صورت خطی مقیاس‌پذیر است، پس می‌توانید عملکرد آن را با افزودن nodeهای بیشتر به کلاستر، افزایش دهید. این قضیه باعث افزایش سرعت پاسخگویی می‌شود.

۷) پشتیبانی از Transaction‌ها:

Cassandra از خواص ACID (یا Atomicity Consistency Isolation Durability) برای تراکنش‌ها در دیتابیس پشتیبانی می‌کند.

منبع: https://www.geeksforgeeks.org/introduction-to-apache-cassandra

خدمات رایگان لیارا

۲.۵ گیگابایت فضای ذخیره‌سازی ابری رایگان

۲.۵ گیگابایت Object Storage سازگار با پروتکل S3 با دیسک‌های SSD به‌صورت رایگان دریافت کنید.

هاست رایگان برای دیتابیس‌

دیتابیس‌های MariaDB، PostgreSQL و Redis را فقط با یک کلیک و به‌صورت رایگان تهیه کنید.

سرویس DNS رایگان

به سادگی دامنه‌تان را اضافه کنید و به صورت رایگان رکورد‌های آن را مدیریت کنید.

۱۰۰ هزار تومان اعتبار اولیه

بعد از ثبت نام در لیارا مبلغ ۱۰۰ هزار تومان اعتبار هدیه دریافت می‌کنید که با توجه به ساعتی بودن هزینه سرویس‌ها، می‌توانید تمامی خدمات پولی را برای چندین هفته رایگان استفاده کنید.

ارسال ۱۰۰ ایمیل تراکنشی رایگان در هر ماه

در سرویس ایمیل لیارا شما می‌توانید تا ۱۰۰ ایمیل رایگان در هر ماه ارسال کنید و فقط برای بیش از آن هزینه پرداخت کنید. (به‌همراه دسترسی SMTP)

هاست رایگان برای انواع وبسایت

تفاوتی ندارد برای وبسایت خود از Node استفاده می‌کنید یا Laravel و Django، در لیارا می‌توانید به صورت کاملا رایگان آن را میزبانی کنید.

توسعه‌دهندگان درباره‌ی ما چه می‌گویند

تجربه کار باliara_cloud@امروز خیلی خوب بود. یکی از سرویس هام رو منتقل کردم روش و راضیم. انقد سریع و جذاب کارم راه افتادم اصن باورم نمیشد! برعکس سرویس های PaaS دیگه با اون همه پیچیدگیشون. دمتون گرم
...

MohammadReza
liara testimonial
keikaavousi

بعد از بسته شدن @fandoghpaas و ناراحتی همه‌مون از اینکه یه سرویس خوب و صادق نمی‌تونه از پس هزینه‌ها بر بیاد، سرویسم رو منتقل کردم به پاس لیارا (https://liara.ir @liara_cloud) . تجربه راحت و خوب. تفاوت‌هایی داشت که کمی کار می‌خواست ولی تا الان کاملا راضی.

jadi
liara testimonial
jadi

یه خسته نباشید باید به تصمیمliara_cloud@بگم،
بعد از چندین روز سرکله زدن با سرویس های مشابه بالاخره تصمیم گرفتم لیارا رو امتحان کنم و باور نمیشه ۱۰ دقیقه بیشتر وقت نبرد،
دمتون گرم.

Arch
liara testimonial
EbadiDev

واسه سرویس PaaS با اختلاف لیارا بهترین رابط کاربری داره و یکی از مزیت‌های سرویس دیتابیس‌شون اینه که خودشون به صورت دوره‌ای بکآپ میگیرن.
...

Ali Najafi
liara testimonial
me_ali_najafi

یکی از کارهای خوبی که جدیداً میکنم اینه که یه دیتابیس روی لیارا میسازم و به پروژه وصل میکنم اینطوری هم خونه و هم محل کار دیتابیس بروز رو دارم و راحت میتونم ادامه بدم کار روliara_cloud@

Navid
liara testimonial
1navid

عاشقliara_cloud@شدم درسته در حد AWS نیست ولی خب تجربه خوبی واسه پروژه های داخل ایران ارائه میده، میتونم رو CD هم اجراش کنم

Amir H Shekari
liara testimonial
vanenshi