حافظه Heap و Stack
- مقدمه
حافظه مجازی در کامپیوتر، یک آرایه بزرگ طولانی از بیت هستش و این بیت ها به بلوک هایی به نام بایت تقسیم میشن(هر 8 بیت = 1 بایت) و به هر بایت یک آدرس جهت دسترسی اختصاص داده می شه.
در زبانهای برنامه نویسی، وقتی با داده های غیرفیزیکی(مثل متغیر ها، اشیا، توابع و...) کار می کنید، مقدار و آدرس این داده ها در حافظه مجازی ذخیره میشه. در سطح پایینتر، وقتی متغیر محلی(local variable) یا تابعی تعریف و استفاده می کنید مقادیر و آدرسشون در قسمت Stack حافظه مجازی قرار می گیره. ولی با ساخت شی یا اختصاص حافظه بصورت دستی(Dynamic)، مقدار و آدرسشون در قسمت Heap حافظه مجازی قرار میگیره. و نهایتاً همه اینها در سلول های RAM سخت افزاری کامپیوتر بصورت منظم چیده میشن.
فهرست/مندرجات:
- حافظه Stack
- قوائد حافظه Stack
- مشکل Stackoverflow
- حافظه Heap
- قوائد حافظه Heap
- Garbage Collector / GC
- مشکل Memory leak
- حافظه Stack
حافظه Stack مثل دسته ای از بشقاب هستش که روی هم قرار گرفتن... هروقت بخواهید بشقابی روی دسته بشقاب ها قرار بدید(Push) اون رو در بالا قرار میدید. به همین ترتیب هروقت بخواهید بشقابی از این دسته بردارید(Pop) همیشه بشقاب بالایی رو برمیدارید... که این دسته رو Stack هه LIFO یا همون LastIn-FirstOut می نامن.
حافظه Stack در قسمت user-space حافظه قرار داره و بصورت خودکار توسط CPU مدیریت میشه. این حافظه محل نگهداری متغیرهای محلی غیر استاتیک، پارامتر های توابع و آدرس های بازگشتی(return) توابع هست که بصورت LIFO)Last In First Out) داخل این حافظه بر روی هم انباشته میشن و به Frame معروفند. وقتی تابعی فراخونی و اجرا میشه، تابع، پارامترهاش و همه متغیرهای غیر static داخلیش در حافظه Stack قرار میگیرن. با فراخوانی تابع جدید، این تابع بر روی تابع قبلی قرار میگیره و زمانی که کار یکی از این توابع تموم شد، اون تابع به همراه تمام متغیرهای مربوطه از داخل حافظه Stack خارج میشه... و کار به همین شکل ادامه پیدا می کنه.
نکته: نام دیگر این از نوع تخصیص حافظه، Static memory allocation یا اختصاص حافظه بصورت ایستا هستش.
نکته 2: حافظه ای که در نرم افزارهای Memory Firewall ازش صحبت میشه، همین قسمت Stack و Heap حافظه مجازی هستش و نه حافظه فیزیکی/RAM.
نکته 3: در بعضی زبانهای برنامه نویسی مثل Cpp قادرید شی رو در حافظه Stack هم ذخیره کنید، به شرط اینکه داخل تابع باشه و از new استفاده نکنید.
مثال:
function myFunction (param1, param2) // To Stack memory { _testVar = param1 + param2; // To Stack memory return _testVar; // To Stack memory }
مثال تصویری:
- قوائد حافظه Stack
- در حافظه مجازی دستگاه، قسمت Stack قرار داره.
- محل ذخیره متغیرهای محلی(غیر static)، پارامتر های توابع، آدرس های بازگشتی(return) توابع هست. (همچنین ردگیری توابع تودرتو)
- سایز Stack برنامه هنگام Compile تعیین و تخصیص داده میشه.
- در مقابل مشکل Stackoverflow پاسخگو هستش.
- بصورت خودکار توسط CPU مدیریت میشه.
- با فراخوانی تابع، Push میشه بداخل حافظه Stack و با خاتمه کار تابع، Pop میشه از داخل حافظه Stack.
- از نظر سرعت در اشغال فضا، از حافظه Heap سریعتره.
- در زبان C/Cpp، کلاس ها و ساختمان ها درصورت عدم استفاده از اشاره گر در حافظه Stack ذخیره میشن.
- در حین allocation/اشغال نابخردانه یا بیش از ظرفیت می تونه خطای stackoverflow رخ بده.
- هر برنامه دارای یک thread main و هر thread دارای یک حافظه Stack خصوصی هست. پس تا زمانیکه thread بسته نشده Stack ش هم وجود داره. (در اینجا بستن یعنی exit و نه terminate)
- حوزه ی حافظه Stack برنامه به thread اون برنامه ضمیمه شده.
- داده ها در حافظه Stack بترتیب بر روی هم قرار می گیرند. (با قائده LIFO)
- با افزایش مصرف حافظه stack، حافظه کمتری برای heap باقی می مونه.
- این نوع از حافظه readable و writable هستش.
- و...
- مشکل Stackoverflow
واژه stackoverflow در لغت بمعنی سرریز شدن Stack هستش. از جمله دلایل خطای stackoverflow میشه عمق زیاد توابع تودرتو/nested و chain، متغیرهای محلی حجیم، بزرگ شدن بیش از حد سایز stack، تخریب یا corrupt شدن قسمتی از memory، استفاده اشتباه از Native API رو نام برد.
نکته: مشکل Stackoverflow از دسته Error ها هستش و نه Exception ها.
با اجرای کدهای زیر درک بیشتری نسبت به حافظه Stack و مشکل Stackoverflow پیدا خواهید کرد:
مثال PHP:
<?php function myInfiniteRecursion() { myInfiniteRecursion(); } myInfiniteRecursion();
PHP Fatal error: Allowed memory size of 134217728 bytes(134MB) exhausted (tried to allocate 130968 bytes) in develop.php on line 7.
در این مثال با هربار فراخوانی تابع myInfiniteRecursion()
، یک Stack Frame برای اون تابع در حافظه Stack ایجاد میشه و این روند تا جایی که موتور PHP (مقدار memory_limit در php.ini) اجازه داشته باشه ادامه پیدا میکنه... نهایتاً ظرفیت مجاز حافظه Stack موتور PHP پر میشه و اسکریپت سعی میکنه به خارج از ظرفیت حافظه Stack دسترسی پیدا کنه اما سیستم اجازه نمیده و اسکریپت رو با خطای stackoverflow/0xC00000FD متوقف میکنه.
مثال Java:
class MyClass { private MyClass myCls = new MyClass(); public static void main(String[] args) { new MyClass(); } } // javac MyClass.java // java MyClass 2> Errors.txt
Exception in thread "main" java.lang.StackOverflowError
مثال #C:
class Program { static void Recursive() { Recursive(); } static void Main() { Recursive(); } }
System.StackOverflowException: 'Exception of type '' was thrown.'
مثال C:
int main() { int large[10000000] = {0}; return 0; }
Linux: Segmentation fault.
Windows: Unhandled exception in develop.exe: 0xC00000FD: Stackoverflow.
میبینید که در همه خطاها واژه stack و overflow مشترکه;
نکته ویندوزی: توسط برنامه editbin موجود در VS و nasm32 قادرید سایز stack برنامه های اجرایی رو تغییر بدید.
توجه: خطای buffer overflow با خطای stack overflow ارتباطی نداره و این دو با هم تفاوت دارن.
- حافظه Heap
حافظه Heap در قست user-space حافظه مجازی قرار داره و بصورت دستی توسط برنامه نویس مدیریت میشه. درواقع دادها در این حافظه توسط برنامه نویس ذخیره میشن و توسط خود برنامه نویس هم باید تخلیه/نابود بشن. داده های ذخیره شده در حافظه Heap، با اتمام فراخونی از بین نمیرن و تا زمانی هم که خود برنامه نویس این داده ها رو از داخل حافظه Heap پاک نکنه باقی می مونن و حتی باعث وقوع memory leak یا OutOfMemory میشن. مگر اینکه توسط Garbage Collector شناسایی و نابود بشن.
نکته: در اینجا منظور از داده ها، اشیایی که بوسیله new
ساخته میشن، متغیرهایی که توسط calloc/alloc/malloc
تعریف میشن و مقادیری که توسط اشاره گرها جابجا میشن هستش.
نکته 2: نام دیگر این نوع تخصیص حافظه، Dynamic memory allocation یا اختصاص حافظه بصورت پویا هستش.
سایز حافظه Heap، نسبت به سایز کل داده ها (که در بالا اشاره شد) تعیین میشه و سیستم عامل تا جایی که براش مقدور باشه و کاربر محدود نشده باشه و فضای خالی هم در RAM داشته باشه به برنامه فضای Heap میده.
نکته: در زبانهای اسکریپتی، مدیریت حافظه Heap توسط مفسر انجام میشه و در VM ها توسط runtime language.
- قوائد حافظه Heap
- در حافظه مجازی دستگاه، قسمت Heap ذخیره میشه.
- محل ذخیره اشیا و داده های alloc شده هستش.
- حافظه Heap در مقابل مشکل memory leak و OutOfMemory پاسخگو هستش.
- از نظر سرعت در اشغال فضا، از حافظه Stack کندتره چون توسط pointer ها مدیریت میشه.
- در Cpp، داده ذخیره شده در حافظه Heap توسط اشاره گر فراخونده میشه و می تونه مجدداً اشغال بشه.
- هنگام allocation/رزرو نابخردانه حافظه می تونه OutOfMemory رخ بده.
- داده ها در این فضا بصورت random در کنار هم قرار می گیرن.
- حوزه ی حافظه Heap وابسته به runtime برنامست. یعنی با شروع برنامه اشغال و با بستن برنامه تخلیه میشه.
- سایز حافظه Heap برنامه هنگام runtime/شروع برنامه رزرو/allocate میشه.
- (در بیشتر زبانها) همه thread ها فقط از یک حافظه Heap بهره می برن.
- با افزایش مصرف حافهظ Heap، حافظه کمتری برای stack باقی می مونه.
- با بسته شدن برنامه، فضای allocate شده در Heap توسط برنامه تخلیه میشه.
- و...
نکته: مشکل OutOfMemory از دسته Error ها هستش و نه Exception ها.
مثال PHP:
$objTest = New MyObject(); // MyObject to Heap memory
مثال Java و #C:
MyObject objTest = New MyObject(); // to Heap memory
مثال C:
int *ptr = new int; // 4 bytes in the Heap memory
در مثال اول و دوم با ساختن شی MyObject مقداری از حافظه Heap رو اشغال کردیم، درواقع یعنی شی MyObject رو داخل حافظه Heap کردیم و نه متغیرش رو. در مثال سوم هم 4 بایت با متغیر ptr
توسط malloc
رو داخل حافظه Heap کردیم که بعداً باید با کدنویسی آزاد و نابودش کنیم. ولی اینکار فقط در Cpp/C و زبانهای سطح پایین امکان پذیره، و نه در جاوا, PHP و زبانهای سطح بالا!
پس تکلیف تخلیه حافظه در زبانهای سطح بالا چی میشه؟ چون حافظه هم یک حداکثر ظرفیتی رو داره و فقط بخشی کوچیکی از اون در اختیار برنامه ماست...
جواب این مسئله، Garbage Collector هستش! سیستم garbage collection برای زبانهای سطح بالا طراحی شده تا این کمبود رو تا حدودی پوشش بده.
نکته ویندوزی: توسط برنامه editbin موجود در VS و nasm32 قادرید سایز heap برنامه های اجرایی رو تغییر بدید.
- Garbage Collector / GC
سیستم garbage collector (به اختصار GC) امکانی هست که [معمولاً] بصورت خودکار اجرا میشه و شروع به چک کردن اشیایی می کنه که برنامه دیگه ازشون استفاده ای نمی کنه(dead هستن) و هیچ reference ای هم بهشون اشاره نمی کنه(unreferenced) سپس اونها رو نابود می کنه.
این همون پروسه 2 فازست که هر garbage collector ای برای تخلیه حافظه انجام میده.
معمولاً garbage collector وقتی وارد عمل میشه که:
- عمل read/write در حافظه سیستم بکندی صورت میگیره.
- برنامه/اسکریپت کارش تموم شده و می خواد بسته بشه.
- بصورت دستی صدا زه بشه (مثل IDE های Netbeans, Eclipse زبان Java, PHP5.3 و...).
نکته: collect شدن یا نشدن اشیا توسط garbage collector هیچ ارتباطی به مسئله حوزه/scope نداره.
همونطور که گفته شد، VM ها و مفسرها اشیاه ساخته شده توسط برنامه درحال اجرا رو در حافظه Heap ذخیره میکنن. مثل اشیایی که توسط new ساخته میشن. در زمانی که Heap به کندی عمل می کنه، VM یا مفسر، سیستم garbage collection رو براه میندازه; سپس پروسه garbage collection بصورت چرخشی اجرا میشه و اشیا و داده های قابل collect شدن رو از حافظه Heap پاک می کنه... که البته خود GC کمی هم باعث کندی سیستم میشه تا عملیاتش به پایان برسه.
- Memory leak
به اختصار یعنی: اشیا دیگر توسط برنامه استفاده نمی شوند، در جایی به اونها رفرنس شده و Garbage Collector هم قادر به آزاد سازی(نابود کردن) شون نیست.
به عبارت دیگر: مشغول(in use) نگه داشتن بی دلیل اشیا ساخته شده، که برابره با نادیده گرفته شدن توسط garbage collector. (طبق قانون GC)
تعاریف دیگر:
Failure to release unreachable memory, which can no longer be allocated again by any process during execution of allocating process.
Definition: Failure to release memory after allocation.
نکته 2: سیستم garbage collector بیمه ای برای رفع این گونه خرابکاری ها و کدنویسی های غلط نیست، بلکه فقط یک سیستم کمکی هستش.
مثال memory leak در PHP:
class MyClass { // ... } $obj = new MyClass; $obj->self = $obj; // Memory leak by $obj
مثال memory leak در C:
int main() { char *myVar = new char[5]; // Got 5 bytes in Heap memory. return 0; // Memory leak by myVar, FORGOT to delete/free myVar. }
مثال memory leak در Java ی اندروید:
@Override protected void onCreate(Bundle state) { super.onCreate(state); TextView myTextView = new TextView(this); // Memory leak backgroundImage = getDrawable(R.drawable.large_bitmap); myTextView.setBackgroundDrawable(backgroundImage); setContentView(myTextView); // Memory leak }
در این مثال جاوا، 2 بار memory leak رخ میده، 1- در وضعیت کنونی بخاطر مشغول نگه داشتن متغیر شی myTextView توسط اکتیویتی 2- در وضعیتی که Orientation دستگاه تغییر کنه، بنابراین متد onCreate مجدداً فراخوانی میشه.
البته بیشترین حساسیت memory leak در سیستمهایی هستش که با محدودیت منابع روبرو هستید یا برنامه های نوع service.
شرح کاملی از stack, heap, data هر پروسس در حافظه مجازی
پیشنهاد می کنم برای درک بهتری از حافظه Heap و Stack این مقاله رو دوبار مطالعه کنید.
عالی بود بسیار شیوا و قابل فهم