بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

تقطیع کلمات انگلیسی بهم چسبیده


این پکیج امکان تفکیک یک رشته متصل انگلیسی (بدون فاصله) را به اجزای سازنده‌اش به محتمل‌ترین شکل فراهم می‌کند. به عنوان مثال:

thisisagoodexample

به صورت زیر تفکیک خواهد شد:

['this', 'is', 'a', 'good', 'example']

برای نصب پکیج از دستور pip استفاده می‌کنیم:

pip install wordninja

برای تفکیک متن نیز به صورت زبر عمل می‌کنیم:

import wordninja
wordninja.split('thisisagoodexample'.lower())

توجه کنید که به منظور عملکرد بهتر پکیج از تابع lower استفاده کردیم.

دوره آموزشی متن کاوی با پایتون مقدماتی (مجازی)

لینک کوتاه

لینک کوتاه

بازگشت به بالا

پست های مرتبط

یادگیری ماشین در پزشکی

تاریخ: 1400/02/06

بازدید: 6170

1400

زمان مطالعه: 5 دقیقه دقیقه

فعالیت های اداره تحلیل دادگان در حوزه پزشکی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

پردازش زبان طبیعی چیست ؟

تاریخ: 1400/09/30

بازدید: 2635

1400

زمان مطالعه: 5 دقیقه دقیقه

پردازش زبان طبیعی یکی از زیرشاخه های مهم در حوزه علوم کامپیوتر ، هوش مصنوعی و نیز زبان شناسی محاسباتی است که به تعامل بین کامپیوتر و زبان های طبیعی یا انسانی می پردازد .

Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

تحلیل احساس در شبکه‌های اجتماعی

تاریخ: 1401/05/11

بازدید: 1411

1401

زمان مطالعه: 2 دقیقه

با امکانات شبکه‌های اجتماعی، افراد می‌توانند افکار و احساس خود را آزادانه به‌اشتراک بگذارند.

Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

ابزار نگارش هوش مصنوعی KoalaChat

تاریخ: 1402/01/20

بازدید: 41795

1402

زمان مطالعه: 2 دقیقه

ابزار نگارش هوش مصنوعی چیست ؟

Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins

روابط اصطلاحات در پردازش زبان طبیعی

تاریخ: 1400/01/18

بازدید: 3036

1400

زمان مطالعه: 5 دقیقه دقیقه

تعاریف برخی از اصطلاحات پردازش زبان طبیعی

Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمدرس

@ins