فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی





متن کامل


اطلاعات دوره: 
  • سال: 

    1402
  • دوره: 

    12
  • شماره: 

    1
  • صفحات: 

    48-59
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    21
  • دانلود: 

    0
چکیده: 

عدم پشتیبانی صریح همگام سازی بین بلاکی در مدل برنامه نویسی کودا، باعث تضعیف کارآیی در برخی از برنامه های کاربردی شده است. بنابراین در چنین برنامه هایی، همگام سازی بین بلاکی باید به صورت نرم افزاری پیاده سازی شود. روش های باقفل و بدون قفل برای این مسئله پیاده سازی شده اند. در همگام سازی باقفل، زمان اجرا با افزایش تعداد بلاک رشد چشمگیری دارد و در روش همگام سازی بدون قفل، محدودیت تعداد بلاک ها وجود دارد. در این مقاله، دو روش همگام سازی بین بلاکی پیشنهاد می شوند. اولین روش مبتنی بر همگام سازی باقفل است که با گروه بندی مناسب بلاک ها، تاثیر افزایش تعداد بلاک بر زمان اجرا را کاهش می-دهد. دومین روش پیشنهادی همگام سازی بدون قفل است که با ایجاد یک سلسله مراتبی درختی از بلاک ها، محدودیت تعداد بلاک-ها در این همگام سازی را مرتفع می کند. این روش ها برای همگام سازی بین بلاکی در الگوریتم های اسمیت واترمن و مرتب سازی بایتونیک به کار گرفته شده اند. نتایج آزمایش ها نشان می دهند که روش باقفل پیشنهادی، زمان اجرای همگام سازی را بهبود می بخشد و تسریع 1. 84 در الگوریتم اسمیت واترمن و 2. 24 را در الگوریتم مرتب سازی بایتونیک ثبت کرده است. همچنین نتایج نشان می دهند که در روش پیشنهادی بدون قفل نیز با انتخاب درست تعداد سطوح سلسله مراتب درختی، هر تعداد بلاک می توانند همگام شوند و بنابراین محدودیت تعداد بلاک ها مرتفع شده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 21

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1395
  • دوره: 

    3
تعامل: 
  • بازدید: 

    291
  • دانلود: 

    220
چکیده: 

لطفا برای مشاهده چکیده به متن کامل (PDF) مراجعه فرمایید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 291

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 220
اطلاعات دوره: 
  • سال: 

    2016
  • دوره: 

    6
تعامل: 
  • بازدید: 

    156
  • دانلود: 

    0
چکیده: 

IMAGE WATERMARKING IN DCT DOMAIN HAS A HIGH COMPUTATIONAL COMPLEXITY ESPECIALLY FOR COLOR AND HIGH RESOLUTION IMAGES, WHERE USAGE OF THEM HAS BEEN SIGNIFICANTLY GROWN. TO ADDRESS THIS ISSUE, IN THIS ARTICLE, A DATA-PARALLEL COLOR DCT WATERMARKING APPROACH IS PROPOSED AND IMPLEMENTED ON GPU USING CUDA. ALSO, IN THIS WORK, BEFORE EMBEDDING, THE COLOR WATERMARK IS COMPRESSED USING A MODIFIED METHOD TO GET LESS DISTORTION. CUDA IMPLEMENTATION OF 8×8 DCT OFFERS 12X-43X SPEEDUP WITH GT 540M AND 94X-105X SPEEDUP WITH GTX 580, FOR DIFFERENT IMAGE SIZES. IN CASE OF EMBEDDING PROCEDURE, THE SPEEDUP OBTAINED BY GT 540M IS BETWEEN 7X AND 26X, AND THE SPEEDUP OBTAINED BY GTX 580 IS BETWEEN 46X AND 73X, FOR VARIOUS CASE STUDIES. FURTHERMORE, IN CASE OF EXTRACTING PROCEDURE, GT 540M LEADS TO A SPEEDUP BETWEEN 10X AND 29X, AND GTX 580 LEADS TO A SPEEDUP BETWEEN 75X AND 80X, FOR VARIOUS CASE STUDIES.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 156

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
نویسندگان: 

KAZEMI MAHMOUD | MIRZAEI MEYSAM | ISFAHANI REZA

اطلاعات دوره: 
  • سال: 

    2017
  • دوره: 

    3
  • شماره: 

    2
  • صفحات: 

    81-88
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    220
  • دانلود: 

    0
چکیده: 

There are several different methods to make an efficient strategy for steganalysis of digital images. A very powerful method in this area is rich model consisting of a large number of diverse sub-models in both spatial and transform domain that should be utilized. However, the extraction of a various types of features from an image is so time consuming in some steps, especially for training phase with a large number of high resolution images that consist of two steps: train and test.Multithread programming is a near solution to decreasing the required time but it’s limited and it ‘snot so scalable too. In this paper, we present a CUDA based approach for data-parallelization and optimization of sub-model extraction process. Also, construction of the rich model is analyzed in detailed, presenting more efficient solution. Further, some optimization techniques are employed to reduce the total number of GPU memory accesses. Compared to single-thread and multi-threaded CPU processing, 10x-12x and 3x-4x speedups are achieved with implementing our CUDA-based parallel program on GT 540M and it can be scaled with several CUDA cards to achieve better speedups…..

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 220

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

Samadiyeh Hossein | Khajavi Reza

اطلاعات دوره: 
  • سال: 

    2016
  • دوره: 

    2
  • شماره: 

    2
  • صفحات: 

    185-202
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    204
  • دانلود: 

    0
چکیده: 

Among different discretization approaches, Finite Difference Method (FDM) is widely used for acoustic and elastic full-wave form modeling. An inevitable deficit of the technique, however, is its sever requirement to computational resources. A promising solution is parallelization, where the problem is broken into several segments, and the calculations are distributed over different processors. For the present FD routines, however, such parallelization technique inevitably needs domain-decomposition and inter-core data exchange, due to the coupling of the governing equations. In this study, a new FD-based procedure for seismic wave modeling, named as ‘ Modal Finite Difference Method (MFDM)” is introduced, which deals with the simulation in the decoupled modal space; thus, neither domaindecomposition nor inter-core data exchange is anymore required, which greatly simplifies parallelization for both MPI-and CUDA implementations over CPUs and GPUs. With MFDM, it is also possible to simply cut off less-significant modes and run the routine for just the important ones, which will effectively reduce computation and storage costs. The efficiency of the proposed MFDM is shown by some numerical examples.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 204

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

محمودی داریان حسین

اطلاعات دوره: 
  • سال: 

    1398
  • دوره: 

    16
  • شماره: 

    55
  • صفحات: 

    113-131
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    354
  • دانلود: 

    145
چکیده: 

در این مقاله یک روش کارآمد برای تعریف توابع چندمتغیره با الگوهای عبارت برای محاسبات آرایه ای در زبان برنامه نویسی سی پلاس پلاس جهت استفاده در شبیه سازی های دینامیک سیالات محاسباتی معرفی می شود. پیاده سازی روش با استفاده از الگوهای متغیر که از قابلیت های جدید زبان سی پلاس پلاس است، صورت می گیرد. سادگی استفاده برای کاربران در زمینه های محاسباتی، از مزایای روش می باشد، طوری که کاربر بدون نیاز به اطلاع از مفاهیم برنامه نویسی با الگوها به راحتی می تواند تابع خود را با هر تعداد آرگومان ورودی تعریف و سپس استفاده نماید. روش حاضر می تواند جایگزین الگوهای عبارت مرسوم در توسعه کتابخانه های عددی باشد. برای سه تابع مختلف، شامل عملیات حسابی و توابع مثلثاتی، کارایی روش ارائه شده با روش الگوهای عبارت مرسوم، دو نحو مختلف زبان سی پلاس پلاس و زبان فرترن برای آرایه هایی با اندازه های مختلف، مقایسه می شود. به علاوه کارایی روش از لحاظ زمان ترجمه و حجم فایل اجرایی با مترجم های مختلف نشان داده می شود. مقایسه مشابهی روی پردازنده های گرافیکی با زبان کودا صورت می گیرد و کارایی روش نشان داده می شود. نتایج بیانگر آن است که روش حاضر برای هر تعداد درایه به لحاظ زمان محاسبات، زمان ترجمه و حجم فایل اجرایی کارایی بسیار خوبی دارد. در نهایت به عنوان کاربردی از روش پیشنهادی یک شبیه سازی عددی انجام می گیرد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 354

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 145 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1387
  • دوره: 

    34
  • شماره: 

    3 (بخش ریاضی - شماره ویژه)
  • صفحات: 

    67-73
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1985
  • دانلود: 

    0
چکیده: 

در این مقاله برنامه ای برای موازی سازی همترازی توالی ها به کمک الگوریتم اسمیت - واترمن به منظور جستجوی تشابه بین یک توالی با تک تک توالی های موجود در یک پایگاه داده توالی با استفاده از پردازنده های گرافیکی ارایه شده است. این برنامه بر اساس معماری پردازش موازی بکار رفته در نسل جدید پردازنده های گرافیکی شرکت NVIDIA که بنام CUDA معروف است و از توان پردازنده های گرافیکی سود می جوید، طراحی شده است. الگوریتم های همترازی توالی ها برای یافتن نواحی مشابه بین دو توالی و هم چنین بین یک توالی مورد پرس و جو و تمامی توالی های موجود در پایگاه داده های توالی مورد استفاده قرار می گیرند. در این برنامه هر ترد (Thread) مسوول ساخت یک ماتریس امتیازدهی بین توالی مورد پرس و جو و یک توالی از پایگاه داده توالی می باشد. این الگوریتم بر اساس استفاده از حافظه مشترک سریع درون پردازنده برای نگه داری چهار ستون میانی هر مرحله از محاسبه شکل گرفته است. اگر پایگاه داده توالی به اندازه کافی بزرگ باشد، می توان از تمام توان پردازشی تراشه گرافیکی استفاده کرد. برای انجام آزمایش و حصول نتایج از یک پردازنده سطح بالای (E6600 core 2 duo) Intel و یک کارت گرافیک متوسط (Geforce 8600 GT) NVIDIA استفاده گردید که در این شرایط افزایش سرعتی حدود بیست برابر مشاهده شد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1985

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسنده: 

Mahmoodi Darian Hossein

اطلاعات دوره: 
  • سال: 

    2015
  • دوره: 

    16
تعامل: 
  • بازدید: 

    139
  • دانلود: 

    0
چکیده: 

A DOUBLE-GPU CODE IS DEVELOPED TO SIMULATE COMPRESSIBLE VISCOUS EQUATIONS. THE CODE WRITTEN IN CUDA PROGRAMMING LANGUAGE IS DEVELOPED BY MODIFYING A SINGLE-GPU CODE. THE OPENMP LIBRARY IS USED FOR PARALLEL EXECUTION OF THE CODE ON BOTH THE GPUS. DATA TRANSFER BETWEEN GPUS WHICH IS THE MAIN ISSUE IN DEVELOPING THE CODE, IS CARRIED OUT BY DEFINING HALO POINTS FOR NUMERICAL GRIDS AND ALSO BY USING CUDA BUILT-IN FUNCTIONS.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 139

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
نویسندگان: 

Mahmoodi Darian Hossein

اطلاعات دوره: 
  • سال: 

    2017
  • دوره: 

    48
  • شماره: 

    2
  • صفحات: 

    161-170
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    295
  • دانلود: 

    0
چکیده: 

A double-GPU code is developed to accelerate WENO schemes. The test problem is a compressible viscous flow. The convective terms are discretized using third-to ninth-order WENO schemes and the viscous terms are discretized by the standard fourth-order central scheme. The code written in CUDA programming language is developed by modifying a single-GPU code. The OpenMP library is used for parallel execution of the code on both the GPUs. Data transfer between GPUs which is the main issue in developing the code, is carried out by defining halo points for numerical grids and by using a CUDA built-in function. The code is executed on a PC equipped with two heterogeneous GPUs. The computational times of different schemes are obtained and the speedups with respect to the single-GPU code are reported for different number of grid points. Furthermore, the developed code is analyzed by CUDA profiling tools. The analyze helps to further increase the code performance.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 295

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

MOHAMMADI M. | FAZLALI M. | HOSSEINZADEH M.

اطلاعات دوره: 
  • سال: 

    2022
  • دوره: 

    10
  • شماره: 

    1
  • صفحات: 

    75-88
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    125
  • دانلود: 

    0
چکیده: 

Background and Objectives: Louvain is a time-consuming community detection algorithm especially in large-scale networks. Using Graphic Processing Unit (GPU) in order to calculate modularity sigma, which is a major processing section in Louvain algorithm, can reduce algorithm execution time and make it practical for large-scale networks. Methods: The proposed algorithm Dynamic CUDA Louvain Method (DCLM) blocks hardware threads dynamically on cores inside GPU. By considering the properties of GPU, this algorithm allocates the maximal number of processing cores to each Stream Multi-Processor (SM) as number of threads in a block. If the number of nodes in the graph is smaller than all physical cores on GPU, number of threads per block Is equal to the ratio number of graph nodes over the number of SMs. Results: The implementation results demonstrated that the proposed algorithm is able to decrease the run time by 15% in comparison with the best past method in the large-scale graph. Conclusion: We have introduced DCLM algorithm based on GPU that accelerates Louvain community detection algorithm. Dynamic allocation of threads to each block has a significant effect on the reduction of algorithm execution time. However, incrementing the number of threads per block alone does not result to acceleration the speed of calculations.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 125

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button