In this undergraduate project, parts of linear algebra that are used in the field of data science have been reviewed and explained. The goal is to provide a suitable resource for undergraduate students looking for linear algebra applications in data science.
First, the basic and required topics that are prerequisites for linear algebra applications in data science are mentioned. After that, various methods of obtaining the inverse matrix and the linear equation apparatus, which are relatively less used in data science, are given. After that, by examining the least squares problem and the singular value analysis method, the great application of this method in digital image compression and dimension reduction is given.
In the end, after examining eigenvalues and eigenvectors as well as the method of finding them (with the help of iterative methods and conversion methods), the basic component analysis method is mentioned and its application in data science, which is the reduction of data dimensions. has been checked.
Keywords: linear algebra, least squares problem, singular value analysis, eigenvalue and eigenvector, principal component analysis, data science
در این پروژه کارشناسی، قسمت هایی از جبر خطی که در حوزه علوم داده کاربرد دارند بررسی و توضیح داده شده اند. هدف تهیه منبعی مناسب در سطح دانشجویان کارشناسی است که به دنبال کاربردهای جبر خطی در علوم داده هستند.
در ابتدا، مباحث اولیه و مورد نیاز که پیش نیاز کاربردهای جبر خطی در علوم داده هستند، ذکر شده است. پس از آن روش های مختلف به دست آوردن ماتریس وارون و همچنین دستگاه معادلات خطی که کاربرد نسبتاً کمتری در علوم داده دارند، آورده شده است. پس از آن با بررسی مسئله کمترین مربعات و روش تجزیه مقدار تکین، کاربرد بسیار این روش در فشرده سازی تصاویر دیجیتالی و کاهش ابعاد آورده شده است.
در پایان، پس از بررسی مقادیر ویژه و بردارهای ویژه و همچنین روش پیدا کردن آن ها (با کمک روش های تکراری و روش های تبدیلی)، روش تحلیل مولفه اساسی ذکر شده و کاربرد آن در علوم داده که همان کاهش ابعاد داده می باشد، بررسی شده است.
کلمات کلیدی: جبر خطی، مسئله کمترین مربعات، تجزیه مقدار تکین، مقدار ویژه و بردار ویژه، تحلیل مولفه اساسی، علوم داده
استفاده از این فایل، با ذکر منبع بلامانع است.