فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی











متن کامل


نویسندگان: 

اطلاعات دوره: 
  • سال: 

    2019
  • دوره: 

    52
  • شماره: 

    2
  • صفحات: 

    1089-1106
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    90
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 90

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1399
  • دوره: 

    7
  • شماره: 

    1
  • صفحات: 

    153-164
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    775
  • دانلود: 

    609
چکیده: 

قطعه بندی معنایی تصویر مبتنی بر شبکه های عصبی عمیق، از رویکردهای مهم محققان بینایی ماشین می باشد. در روش های مبتنی بر شبکه های عصبی عمیق، بطور کلی از یک شبکه پایه که برای کاربرد شناسایی تصویر، آموزش دیده است، بمنظور استخراج ویژگی از تصویر استفاده می شود. از آنجا که ابعاد ویژگی های خروجی از این شبکه های پایه کوچکتر از تصویر ورودی می باشد، لذا با اضافه کردن چندین لایه کانولوشنی به انتهای این شبکه های پایه، ابعاد ویژگی های خروجی از این شبکه ها را به اندازه ابعاد تصویر ورودی می رسانند. استفاده از ویژگی های محلی خروجی از شبکه های پایه، بدون در نظر گرفتن ارتباط کلی بین این ویژگی های محلی، منجر به قطعه بندی ضعیف و ناهموار می شود. بر این اساس، در این تحقیق واحدی با نام "واحد ویژگی های آگاه به محتوا" پیشنهاد می شود. این واحد با کمک ویژگی های محلی خروجی از شبکه های پایه، ویژگی های سطح-تصویر ایجاد می کند. واحد پیشنهادی را می توان در معماری های مختلف قطعه بندی معنایی تصویر قرار داد. در این تحقیق، با اضافه کردن واحد پیشنهادی CAF به معماری های پایه FCN و DeepLab-v3-plus، به ترتیب معماری های FCN-CAF و DeepLab-v3-plus-CAF پیشنهاد شده است. بمنظور آموزش معماری های پیشنهادی از دادگان PASCAL VOC2012 استفاده شده است. نتایج آزمایش ها نشان می دهد که معماری های پیشنهادی نسبت به معماری های پایه مربوطه، به ترتیب 7/2 و 81/1درصد بهبود دقت (mIoU) دارد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 775

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 609 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
عنوان: 
نویسندگان: 

نشریه: 

اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    303
  • شماره: 

    -
  • صفحات: 

    -
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    1
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    2023
  • دوره: 

    55
  • شماره: 

    1
  • صفحات: 

    99-108
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    37
  • دانلود: 

    0
چکیده: 

In recent years, Convolutional Neural Networks (CNNs) have made significant strides in the field of Segmentation, particularly in Semantic Segmentation where both accuracy and efficiency are crucial. However, despite their high accuracy, these deep networks are not practical for real-time use due to their low inference speed. This issue has prompted researchers to explore various techniques to improve the efficiency of CNNs. One such technique is knowledge distillation, which involves transferring knowledge from a larger, cumbersome (teacher) model to a smaller, more compact (student) model. This paper proposes a simple yet efficient approach to address the issue of low inference speed in CNNs using knowledge distillation. The proposed method involves distilling knowledge from the feature maps of the teacher model to guide the learning of the student model. The approach uses a straightforward technique known as pixel-wise distillation to transfer the feature maps of the last convolution layer of the teacher model to the student model. Additionally, a pair-wise distillation technique is used to transfer pair-wise similarities of the intermediate layers. To validate the effectiveness of the proposed method, extensive experiments were conducted on the PascalVoc 2012 dataset using a state-of-the-art DeepLabV3+ Segmentation network with different backbone architectures. The results showed that the proposed method achieved a balanced mean Intersection over Union (mIoU) and training time.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 37

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

Bagheri F. | Tarokh M.J. | Ziaratban M.

اطلاعات دوره: 
  • سال: 

    2021
  • دوره: 

    34
  • شماره: 

    2
  • صفحات: 

    458-469
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    29
  • دانلود: 

    0
چکیده: 

Accurate Segmentation of lesions from dermoscopic images is very important for timely diagnosis and treatment of skin cancers. Due to the variety of shapes, sizes, colors, and locations of lesions in dermoscopic images, automatic Segmentation of skin lesions remains a challenge. In this study, a two-stage method for the Segmentation of skin lesions based on deep learning is presented. In the first stage, convolutional neural networks (CNNs) estimate the approximate size and location of the lesion. A sub-image around the estimated bounding box is cropped from the original image. The sub-image is resized to an image of a predefined size. In order to segment the exact area of the lesion from the normal image, other CNNs are used in the DeepLab structure. The accuracy of the normalization stage has a significant impact on the final performance. In order to increase the normalization accuracy, a combination of four networks in the structure of Yolov3 is used. Two approaches are proposed to combine Yolov3 structures. The Segmentation results of two networks in the DeepLab v3+ structure are also combined to improve the performance of the second stage. Another challenge is the small number of training images. To overcome this problem, the data augmentation is used, as well as using different modes of an image in each stage. In order to evaluate the proposed method, experiments are performed on the well-known ISBI 2017 dataset. Experimental results show that the proposed lesion Segmentation method outperforms the state-of-the-art methods.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 29

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

Ahmadi Rozhan | Kasaei Shohreh

اطلاعات دوره: 
  • سال: 

    2025
  • دوره: 

    57
  • شماره: 

    2
  • صفحات: 

    333-342
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    5
  • دانلود: 

    0
چکیده: 

Recent advancements in Weakly Supervised Semantic Segmentation (WSSS) have highlighted the use of image-level class labels as a form of supervision. Many methods use pseudo-labels from class activation maps (CAMs) to address the limited spatial information in class labels. However, CAMs generated from Convolutional Neural Networks (CNNs) are often led to focus on prominent features, making it difficult to distinguish foreground objects from their backgrounds. While recent studies show that features from Vision Transformers (ViTs) are more effective in capturing the scene layout than CNNs, the use of hierarchical ViTs has not been widely studied in WSSS. This work introduces "SWTformer" and explores the effect of Swin Transformer’s local-to-global view on improving the accuracy of initial seed CAMs. SWTformer-V1 produces CAMs solely based on patch tokens as its input features. SWTformer-V2 enhances this process by integrating a multi-scale feature fusion mechanism and employing a background-aware mechanism that refines the accuracy of localization maps, resulting in better differentiation between objects. Experiments on the Pascal VOC 2012 dataset demonstrate that compared to state-of-the-art models, SWTformer-V1 achieves 0.98% mAP higher in localization accuracy and generates initial localization maps that are 0.82% mIoU higher in accuracy while relying solely on the classification network. SWTformer-V2 enhances the accuracy of the seed CAMs by 5.32% mIoU. Code available at: ttps://github.com/RozhanAhmadi/SWTformer

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 5

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1400
  • دوره: 

    10
  • شماره: 

    4
  • صفحات: 

    88-98
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    73
  • دانلود: 

    20
چکیده: 

امروزه از تقطیع معنایی ویدئو در کاربردهای بسیاری از قبیل خودروهای بدون سرنشین، سیستم های ناوبری، سیستم های واقعیت مجازی و. . . استفاده می شود. در سال های اخیر پیشرفت چشم گیری در تقطیع معنایی تصاویر مشاهده شده است. اما از آن جا که فریم های پشت سر هم یک ویدئو باید با سرعت بالا و تاخیر کم و به صورت بلادرنگ پردازش شوند استفاده از تقطیع معنایی تصویر روی تک تک فریم های ویدئو با مشکل مواجه می شود؛ بنابراین تقطیع معنایی فریم های یک ویدئو به صورت بلادرنگ و با دقت مناسب موضوعی چالش برانگیز است. به منظور مقابله با چالش ذکر شده، در این مقاله یک چارچوب تقطیع معنایی ویدئو معرفی شده است که با در نظر گرفتن تغییرات فریم های پشت سر هم (با استفاده از جریان نوری) و بهره گیری از شبکه عمیق بازگشتی GRU، از اطلاعات تقطیع معنایی فریم های قبلی به منظور افزایش سرعت و دقت استفاده شده است. یک ورودی شبکه GRU تخمینی از تقطیع معنایی فریم فعلی (حاصل از یک شبکه عمیق کانولوشنال از پیش آموزش دیده)، و ورودی دیگر آن لغزش یافته تقطیع معنایی فریم قبلی در راستای جریان نوری دو فریم قبلی و فعلی می باشد. روش پیشنهادی دارای دقت و سرعت قابل رقابت با شناخته شده ترین و بهترین روش ها می باشد. دقت تقطیع معنایی بر اساس معیار ارزیابی mIoU روی مجموعه داده های Cityscapes و Camvid به ترتیب برابر با 83. 1 و 79. 8 می باشد. این در حالیست که در روش پیشنهادی سرعت تقطیع معنایی با استفاده از یک GPU تسلا مدل P4 روی مجموعه داده های Cityscapes و Camvid به ترتیب به 34 و 36. 3 فریم بر ثانیه رسیده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 73

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 20 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

رزاقی پروین

اطلاعات دوره: 
  • سال: 

    1397
  • دوره: 

    5
  • شماره: 

    1
  • صفحات: 

    1-13
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    754
  • دانلود: 

    149
چکیده: 

در این مقاله، روش جدیدی برای بخش بندی معنایی تصاویر در حضور داده های آموزشی نظارتی ضعیف ارائه می گردد. هدف اصلی در بخش بندی معنایی اختصاص برچسب به تمامی پیکسل های تصویر است. در داده های آموزشی نظارتی ضعیف، تنها برچسب های معنایی موجود در تصویر مشخص می گردد و مکان آن ها در تصویر مشخص نمی گردد. نوآوری روش پیشنهادی، استفاده همزمان از اطلاعات سطح شی و سطح متن در تعیین برچسب های معنایی در تصویر می باشد. در روش پیشنهادی، نواحی تصاویری که دارای مجموعه برچسب های یکسانی می باشند، با یکدیگر ترکیب می گردند به گونه ای که در تصاویری که دارای برچسب های مشترک هستند، نحوه ظهور یکسان داشته و موقعیت مکانی آن ها نسبت به دیگر برچسب های معنایی موجود در تصویر نیز یکسان باشد. همچنین برای بهینه کردن تابع هزینه ی پیشنهادی، یک الگوریتم تکرار شونده ارائه شده است که در آن در ابتدا تمامی پیکسل های مجموعه تصاویر، به صورت اولیه برچسب گذاری می گردد. سپس مدل ظهور هر برچسب معنایی و مدل متن آن با استفاده از ماشین بردار پشتیبان آموزش می بیند. در قدم بعد، برچسب پیکسل ها به گونه ای به روزرسانی می گردد که در مجموعه تصاویری که دارای برچسب های یکسانی می باشند، اطلاعات سطح شی و سطح متن مشابه باشند. به روزرسانی برچسب ها تا زمانی ادامه می یابد که در دو دور متوالی، برچسب پیکسل ها تغییر نیابد. برای ارزیابی کارایی روش پیشنهادی از مجموعه داده ی MSRC استفاده شده است. روش پیشنهادی بر روی مجموعه داده ی MSRC، دقت میانگین نرخ شناسایی گروهی 72% را به دست آورده است که در مقایسه با دیگر روش های قابل مقایسه و موفق پیشین 1% افزایش دقت داشته است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 754

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 149 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    2014
  • دوره: 

    1
  • شماره: 

    3
  • صفحات: 

    225-238
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    260
  • دانلود: 

    0
چکیده: 

This paper presents a Semantic method for aerial image Segmentation. Multi-class aerial images are often featured with large intra-class variations and inter-class similarities. Furthermore, shadows, reections and changes in viewpoint, high and varying altitude and variability of natural scene pose serious problems for simultaneous Segmentation. The main purpose of Segmentation of aerial images is to make subsequent recognition phase straightforward. Present algorithm combines two challenging tasks of Segmentation and classification in a manner that no extra recognition phase is needed. This algorithm is supposed to be part of a system which will be developed to automatically locate the appropriate site for Unmanned Aerial Vehicle (UAV) landing. With this perspective, we focused on segregating natural and man-made areas in aerial images. We compared different classifiers and explored the best set of features for this task in an experimental manner. In addition, a certainty based method has been used for integrating color and texture descriptors in a more efficient way. The experimental results over a dataset comprised of 25 high-resolution images show the overall binary Segmentation accuracy rate of 91.34%.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 260

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1399
  • دوره: 

    11
  • شماره: 

    1
  • صفحات: 

    51-59
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    417
  • دانلود: 

    153
چکیده: 

اهمیت و نیاز به درک صحنه های بصری به علت پیشرفت سامانه های خودکار به طور پیوسته افزایش یافته است. جریان نوری یکی از ابزارهای درک صحنه های بصری است. روش های جریان نوری موجود، مفروضات کلی و همگن فضایی، در مورد ساختار فضایی جریان نوری ارایه می دهند. درواقع، جریان نوری در یک تصویر، بسته به کلاس شی و همچنین نوع حرکت اشیاء مختلف، متفاوت است. فرض اول در میان بسیاری از روش ها در این زمینه، پایداری روشنایی در طی حرکت پیکسل ها بین فریم ها است. ثابت شده است که این فرض در حالت کلی صحیح ناست. در این پژوهش از تقسیم بندی اشیای موجود در تصویر و تعیین حرکت اشیا به جای حرکت پیکسلی کمک گرفته شده است. درواقع از پیشرفت های اخیر شبکه های عصبی کانولوشن در تقسیم بندی معنایی صحنه های استاتیک، برای تقسیم تصویر به اشیا مختلف بهره گرفته می شود و الگوهای مختلف حرکتی بسته به نوعشی تعریف می شود. سپس، تخمین جریان نوری با استفاده از ایجاد یک شبکه عصبی کانولوشن عمیق برای تصویری که در مرحله اول تقسیم بندی معنایی شده است، انجام می شود. روش پیشنهادی کمترین خطا در معیار جریان نوری برای پایگاه داده KITTI-2015 را فراهم می آورد و تقسیم بندی بهتری را نسبت به روش های اخیر در طیف وسیعی از فیلم های طبیعی تولید می کند.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 417

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 153 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button