چگونه مقاله دانلود کنم؟

برای دانلود مقاله از SID، ابتدا وارد سایت شوید، عنوان مقاله را جستجو کرده و بر روی گزینه 'دانلود مقاله' کلیک کنید.

چگونه مقاله ISI دانلود کنم؟

برای دانلود مقاله ISI در SID، کلمه کلیدی یا عنوان مقاله را در نوار جستجو وارد کرده و نتایج مرتبط را مشاهده کنید. سپس روی مقاله مورد نظر کلیک کرده و گزینه 'دانلود مقاله' را انتخاب کنید.

چگونه میتوانم به پایگاه داده SID دسترسی داشته باشم؟

برای دسترسی به پایگاه داده SID، وارد سایت SID.ir شوید، یک حساب کاربری ایجاد کنید و سپس با ورود به حساب خود به منابع علمی دسترسی پیدا کنید.

آیا دانلود مقاله از SID رایگان است؟

بعضی از مقالات در SID بهصورت رایگان در دسترس هستند، اما برخی دیگر نیاز به پرداخت هزینه دارند. اطلاعات بیشتر در صفحه مقاله مشخص شده است.

نتایج جستجو

نتیجه یافت شد

مرتبط ترین ها

اعمال فیلتر

به روزترین ها

اعمال فیلتر

پربازدید ترین ها

اعمال فیلتر

پر دانلودترین‌ها

اعمال فیلتر

پر استنادترین‌ها

اعمال فیلتر

تعداد صفحات

انتقال به صفحه

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

مقاله نشریه

دانلود

نسخه انگلیسی

عنوان:

بهبود روش های همگام سازی بین بلاکی در کودا

نویسندگان:

سوادی عبدالرضا | صلواتی زاده محدثه | ریاحی علی

نشریه:

رایانش نرم و فن آوری اطلاعات

اطلاعات دوره:

سال:
1402
دوره:
12
شماره:
1
صفحات:
48-59

کلیدواژه:

واحد پردازنده ی گرافیکی Q1

کودا Q2

هگام سازی بین بلاکی Q1

همگام سازی باقفل و بدون قفل Q1

چکیده:

عدم پشتیبانی صریح همگام سازی بین بلاکی در مدل برنامه نویسی کودا، باعث تضعیف کارآیی در برخی از برنامه های کاربردی شده است. بنابراین در چنین برنامه هایی، همگام سازی بین بلاکی باید به صورت نرم افزاری پیاده سازی شود. روش های باقفل و بدون قفل برای این مسئله پیاده سازی شده اند. در همگام سازی باقفل، زمان اجرا با افزایش تعداد بلاک رشد چشمگیری دارد و در روش همگام سازی بدون قفل، محدودیت تعداد بلاک ها وجود دارد. در این مقاله، دو روش همگام سازی بین بلاکی پیشنهاد می شوند. اولین روش مبتنی بر همگام سازی باقفل است که با گروه بندی مناسب بلاک ها، تاثیر افزایش تعداد بلاک بر زمان اجرا را کاهش می-دهد. دومین روش پیشنهادی همگام سازی بدون قفل است که با ایجاد یک سلسله مراتبی درختی از بلاک ها، محدودیت تعداد بلاک-ها در این همگام سازی را مرتفع می کند. این روش ها برای همگام سازی بین بلاکی در الگوریتم های اسمیت واترمن و مرتب سازی بایتونیک به کار گرفته شده اند. نتایج آزمایش ها نشان می دهند که روش باقفل پیشنهادی، زمان اجرای همگام سازی را بهبود می بخشد و تسریع 1. 84 در الگوریتم اسمیت واترمن و 2. 24 را در الگوریتم مرتب سازی بایتونیک ثبت کرده است. همچنین نتایج نشان می دهند که در روش پیشنهادی بدون قفل نیز با انتخاب درست تعداد سطوح سلسله مراتب درختی، هر تعداد بلاک می توانند همگام شوند و بنابراین محدودیت تعداد بلاک ها مرتفع شده است.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 21

دانلود 0

استناد 0

مرجع 0

مقاله همایش

دانلود

عنوان:

ارائه روشی موازی با استفاده از CUDA برای کاهش زمان ضرب ماتریس های بزرگ

نویسنده:

عباسی درئی ابوالفضل | عبدلی درئی روح اله | کریمی عباس

همایش:

کنفرانس ملی برق و کامپیوتر

اطلاعات دوره:

سال:
1395
دوره:
3

کلیدواژه:

GPU

ضرب ماتریس های بزرگ

CUDA

چکیده:

لطفا برای مشاهده چکیده به متن کامل (PDF) مراجعه فرمایید.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 291

دانلود 220

مقاله همایش

دانلود

عنوان:

PARALLELIZATION OF A COLOR DCT WATERMARKING ALGORITHM USING A CUDA-BASED APPROACH

نویسنده:

Ahmadi Mohammadabadi Alireza | Chalechale Abdolah

همایش:

INTERNATIONAL CONFERENCE ON COMPUTER AND KNOWLEDGE ENGINEERING (ICCKE)

اطلاعات دوره:

سال:
2016
دوره:
6

کلیدواژه:

CUDA

چکیده:

IMAGE WATERMARKING IN DCT DOMAIN HAS A HIGH COMPUTATIONAL COMPLEXITY ESPECIALLY FOR COLOR AND HIGH RESOLUTION IMAGES, WHERE USAGE OF THEM HAS BEEN SIGNIFICANTLY GROWN. TO ADDRESS THIS ISSUE, IN THIS ARTICLE, A DATA-PARALLEL COLOR DCT WATERMARKING APPROACH IS PROPOSED AND IMPLEMENTED ON GPU USING CUDA. ALSO, IN THIS WORK, BEFORE EMBEDDING, THE COLOR WATERMARK IS COMPRESSED USING A MODIFIED METHOD TO GET LESS DISTORTION. CUDA IMPLEMENTATION OF 8×8 DCT OFFERS 12X-43X SPEEDUP WITH GT 540M AND 94X-105X SPEEDUP WITH GTX 580, FOR DIFFERENT IMAGE SIZES. IN CASE OF EMBEDDING PROCEDURE, THE SPEEDUP OBTAINED BY GT 540M IS BETWEEN 7X AND 26X, AND THE SPEEDUP OBTAINED BY GTX 580 IS BETWEEN 46X AND 73X, FOR VARIOUS CASE STUDIES. FURTHERMORE, IN CASE OF EXTRACTING PROCEDURE, GT 540M LEADS TO A SPEEDUP BETWEEN 10X AND 29X, AND GTX 580 LEADS TO A SPEEDUP BETWEEN 75X AND 80X, FOR VARIOUS CASE STUDIES.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 156

دانلود 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

PARALLELIZATION OF RICH MODELS FOR STEGANALYSIS OF DIGITAL IMAGES USING A CUDA-BASED APPROACH

نویسندگان:

KAZEMI MAHMOUD | MIRZAEI MEYSAM | ISFAHANI REZA

نشریه:

JOURNAL OF ADVANCES IN COMPUTER ENGINEERING AND TECHNOLOGY

اطلاعات دوره:

سال:
2017
دوره:
3
شماره:
2
صفحات:
81-88

کلیدواژه:

CUDA

چکیده:

There are several different methods to make an efficient strategy for steganalysis of digital images. A very powerful method in this area is rich model consisting of a large number of diverse sub-models in both spatial and transform domain that should be utilized. However, the extraction of a various types of features from an image is so time consuming in some steps, especially for training phase with a large number of high resolution images that consist of two steps: train and test.Multithread programming is a near solution to decreasing the required time but it’s limited and it ‘snot so scalable too. In this paper, we present a CUDA based approach for data-parallelization and optimization of sub-model extraction process. Also, construction of the rich model is analyzed in detailed, presenting more efficient solution. Further, some optimization techniques are employed to reduce the total number of GPU memory accesses. Compared to single-thread and multi-threaded CPU processing, 10x-12x and 3x-4x speedups are achieved with implementing our CUDA-based parallel program on GT 540M and it can be scaled with several CUDA cards to achieve better speedups…..

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 220

دانلود 0

استناد 0

مرجع 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

MPI-and CUDA-implementations of modal finite difference method for P-SV wave propagation modeling

نویسندگان:

Samadiyeh Hossein | Khajavi Reza

نشریه:

JOURNAL OF THEORETICAL AND APPLIED VIBRATION AND ACOUSICS

اطلاعات دوره:

سال:
2016
دوره:
2
شماره:
2
صفحات:
185-202

کلیدواژه:

Finite difference method

Graphics Processing Unit (GPU)

Message Passing Interface (MPI)

Modal

Wave propagation

چکیده:

Among different discretization approaches, Finite Difference Method (FDM) is widely used for acoustic and elastic full-wave form modeling. An inevitable deficit of the technique, however, is its sever requirement to computational resources. A promising solution is parallelization, where the problem is broken into several segments, and the calculations are distributed over different processors. For the present FD routines, however, such parallelization technique inevitably needs domain-decomposition and inter-core data exchange, due to the coupling of the governing equations. In this study, a new FD-based procedure for seismic wave modeling, named as ‘ Modal Finite Difference Method (MFDM)” is introduced, which deals with the simulation in the decoupled modal space; thus, neither domaindecomposition nor inter-core data exchange is anymore required, which greatly simplifies parallelization for both MPI-and CUDA implementations over CPUs and GPUs. With MFDM, it is also possible to simply cut off less-significant modes and run the routine for just the important ones, which will effectively reduce computation and storage costs. The efficiency of the proposed MFDM is shown by some numerical examples.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 204

دانلود 0

استناد 0

مرجع 0

مقاله نشریه

دانلود

نسخه انگلیسی

عنوان:

روشی کارآمد برای تعریف توابع چندمتغیره با الگوهای عبارت برای آرایه ها در زبان سی پلاس پلاس و کودا

نویسندگان:

محمودی داریان حسین

نشریه:

مدل سازی در مهندسی

اطلاعات دوره:

سال:
1398
دوره:
16
شماره:
55
صفحات:
113-131

کلیدواژه:

الگوهای عبارت Q2

الگوهای متغیر Q2

سی پلاس پلاس Q2

پردازنده های گرافیکی Q2

کودا Q2

چکیده:

در این مقاله یک روش کارآمد برای تعریف توابع چندمتغیره با الگوهای عبارت برای محاسبات آرایه ای در زبان برنامه نویسی سی پلاس پلاس جهت استفاده در شبیه سازی های دینامیک سیالات محاسباتی معرفی می شود. پیاده سازی روش با استفاده از الگوهای متغیر که از قابلیت های جدید زبان سی پلاس پلاس است، صورت می گیرد. سادگی استفاده برای کاربران در زمینه های محاسباتی، از مزایای روش می باشد، طوری که کاربر بدون نیاز به اطلاع از مفاهیم برنامه نویسی با الگوها به راحتی می تواند تابع خود را با هر تعداد آرگومان ورودی تعریف و سپس استفاده نماید. روش حاضر می تواند جایگزین الگوهای عبارت مرسوم در توسعه کتابخانه های عددی باشد. برای سه تابع مختلف، شامل عملیات حسابی و توابع مثلثاتی، کارایی روش ارائه شده با روش الگوهای عبارت مرسوم، دو نحو مختلف زبان سی پلاس پلاس و زبان فرترن برای آرایه هایی با اندازه های مختلف، مقایسه می شود. به علاوه کارایی روش از لحاظ زمان ترجمه و حجم فایل اجرایی با مترجم های مختلف نشان داده می شود. مقایسه مشابهی روی پردازنده های گرافیکی با زبان کودا صورت می گیرد و کارایی روش نشان داده می شود. نتایج بیانگر آن است که روش حاضر برای هر تعداد درایه به لحاظ زمان محاسبات، زمان ترجمه و حجم فایل اجرایی کارایی بسیار خوبی دارد. در نهایت به عنوان کاربردی از روش پیشنهادی یک شبیه سازی عددی انجام می گیرد.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 354

دانلود 145 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

استناد 0

مرجع 0

مقاله نشریه

دانلود

نسخه انگلیسی

عنوان:

پیاده سازی موازی الگوریتم جستجوی یک توالی در یک پایگاه داده ای با استفاده از پردازنده های گرافیکی

نویسندگان:

نورمفیدی وحید | پارسایی منوچهر | مددکارسبحانی آرمین

نشریه:

مجله علوم دانشگاه تهران

اطلاعات دوره:

سال:
1387
دوره:
34
شماره:
3 (بخش ریاضی - شماره ویژه)
صفحات:
67-73

کلیدواژه:

Alignement؛ Smith-waterman؛ GPU؛ CUDA Q3

چکیده:

در این مقاله برنامه ای برای موازی سازی همترازی توالی ها به کمک الگوریتم اسمیت - واترمن به منظور جستجوی تشابه بین یک توالی با تک تک توالی های موجود در یک پایگاه داده توالی با استفاده از پردازنده های گرافیکی ارایه شده است. این برنامه بر اساس معماری پردازش موازی بکار رفته در نسل جدید پردازنده های گرافیکی شرکت NVIDIA که بنام CUDA معروف است و از توان پردازنده های گرافیکی سود می جوید، طراحی شده است. الگوریتم های همترازی توالی ها برای یافتن نواحی مشابه بین دو توالی و هم چنین بین یک توالی مورد پرس و جو و تمامی توالی های موجود در پایگاه داده های توالی مورد استفاده قرار می گیرند. در این برنامه هر ترد (Thread) مسوول ساخت یک ماتریس امتیازدهی بین توالی مورد پرس و جو و یک توالی از پایگاه داده توالی می باشد. این الگوریتم بر اساس استفاده از حافظه مشترک سریع درون پردازنده برای نگه داری چهار ستون میانی هر مرحله از محاسبه شکل گرفته است. اگر پایگاه داده توالی به اندازه کافی بزرگ باشد، می توان از تمام توان پردازشی تراشه گرافیکی استفاده کرد. برای انجام آزمایش و حصول نتایج از یک پردازنده سطح بالای (E6600 core 2 duo) Intel و یک کارت گرافیک متوسط (Geforce 8600 GT) NVIDIA استفاده گردید که در این شرایط افزایش سرعتی حدود بیست برابر مشاهده شد.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1985

دانلود 0

استناد 0

مرجع 0

مقاله همایش

دانلود

عنوان:

DOUBLE-GPU NUMERICAL SIMULATION OF VISCOUS FLOWS USING HIGH-ORDER WENO SCHEMES

نویسنده:

Mahmoodi Darian Hossein

همایش:

CONFERENCE ON FLUID DYNAMICS

اطلاعات دوره:

سال:
2015
دوره:
16

کلیدواژه:

MULTI-GPU

OPENMP

WENO SCHEMES

COMPRESSIBLE VISCOUS FLOW

چکیده:

A DOUBLE-GPU CODE IS DEVELOPED TO SIMULATE COMPRESSIBLE VISCOUS EQUATIONS. THE CODE WRITTEN IN CUDA PROGRAMMING LANGUAGE IS DEVELOPED BY MODIFYING A SINGLE-GPU CODE. THE OPENMP LIBRARY IS USED FOR PARALLEL EXECUTION OF THE CODE ON BOTH THE GPUS. DATA TRANSFER BETWEEN GPUS WHICH IS THE MAIN ISSUE IN DEVELOPING THE CODE, IS CARRIED OUT BY DEFINING HALO POINTS FOR NUMERICAL GRIDS AND ALSO BY USING CUDA BUILT-IN FUNCTIONS.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 139

دانلود 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

ACCELERATING HIGH-ORDER WENO SCHEMES USING TWO HETEROGENEOUS GPUS

نویسندگان:

Mahmoodi Darian Hossein

نشریه:

THE JOURNAL OF COMPUTATIONAL APPLIED MECHANICS

اطلاعات دوره:

سال:
2017
دوره:
48
شماره:
2
صفحات:
161-170

کلیدواژه:

MULTI-GPU

CUDA

OPENMP

WENO SCHEMES

COMPRESSIBLE VISCOUS FLOW

چکیده:

A double-GPU code is developed to accelerate WENO schemes. The test problem is a compressible viscous flow. The convective terms are discretized using third-to ninth-order WENO schemes and the viscous terms are discretized by the standard fourth-order central scheme. The code written in CUDA programming language is developed by modifying a single-GPU code. The OpenMP library is used for parallel execution of the code on both the GPUs. Data transfer between GPUs which is the main issue in developing the code, is carried out by defining halo points for numerical grids and by using a CUDA built-in function. The code is executed on a PC equipped with two heterogeneous GPUs. The computational times of different schemes are obtained and the speedups with respect to the single-GPU code are reported for different number of grid points. Furthermore, the developed code is analyzed by CUDA profiling tools. The analyze helps to further increase the code performance.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 295

دانلود 0

استناد 0

مرجع 0

مقاله نشریه

دانلود

نسخه فارسی

عنوان:

Parallel Louvain Community Detection Algorithm Based on Dynamic Thread Assignment on Graphic Processing Unit

نویسندگان:

MOHAMMADI M. | FAZLALI M. | HOSSEINZADEH M.

نشریه:

JOURNAL OF ELECTRICAL AND COMPUTER ENGINEERING INNOVATIONS

اطلاعات دوره:

سال:
2022
دوره:
10
شماره:
1
صفحات:
75-88

کلیدواژه:

CUDA

چکیده:

Background and Objectives: Louvain is a time-consuming community detection algorithm especially in large-scale networks. Using Graphic Processing Unit (GPU) in order to calculate modularity sigma, which is a major processing section in Louvain algorithm, can reduce algorithm execution time and make it practical for large-scale networks. Methods: The proposed algorithm Dynamic CUDA Louvain Method (DCLM) blocks hardware threads dynamically on cores inside GPU. By considering the properties of GPU, this algorithm allocates the maximal number of processing cores to each Stream Multi-Processor (SM) as number of threads in a block. If the number of nodes in the graph is smaller than all physical cores on GPU, number of threads per block Is equal to the ratio number of graph nodes over the number of SMs. Results: The implementation results demonstrated that the proposed algorithm is able to decrease the run time by 15% in comparison with the best past method in the large-scale graph. Conclusion: We have introduced DCLM algorithm based on GPU that accelerates Louvain community detection algorithm. Dynamic allocation of threads to each block has a significant effect on the reduction of algorithm execution time. However, incrementing the number of threads per block alone does not result to acceleration the speed of calculations.

بیشتر

شاخص‌های تعامل: مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 125

دانلود 0

استناد 0

مرجع 0

ابتدا 1 2 3 انتها ›

بعدی

پایگاه مرکز اطلاعات علمی جهاد دانشگاهی

ISSN: 2588-4824

نتایج جستجو

مرتبط ترین ها

به روزترین ها

پربازدید ترین ها

پر دانلودترین‌ها

پر استنادترین‌ها