اجتماع یابی (کشف اجتماعات) یکی از شاخه های نوظهور و پرطرف دار در علم داده کاوی و تحلیل شبکه های اجتماعی است که کاربردهای فراوانی در کشف و تحلیل اجتماع ها در سایت های اینترنتی، شبکه های زیستی، علمی و پژوهشی و غیره دارد. اجتماع یابی صفحات اینترنتی می تواند به طور ویژه به مدیران سایت های اینترنتی در تخصیص پهنای بهینه به شبکه صفحات وب تحت نظارتشان کمک کند. در اکثر روش های اجتماع یابی موجود فقط از توپولوژی شبکه (ارتباطات، یال ها) برای گروه بندی گره ها (صفحات وب) استفاده می شود؛ درحالی که نتایج پژوهش های اخیر نشان داده است که این گونه روش ها باید به گونه ای تغییر کند که در آن ها علاوه بر توپولوژی، ویژگی های ذاتی گره ها نیز در فرآیند اجتماع یابی لحاظ شود. ازاین رو در این مقاله برای اولین بار با لحاظ کردنِ هم زمانِ ویژگی های ذاتی صفحات وب و ارتباطات میان آن ها، یک مدل ریاضی برای کشف اجتماعات در شبکه های اینترنتی توسعه داده شده است. روش پیشنهادی این پژوهش بدین صورت است که برای لحاظ کردن ویژگی ها در فرآیند اجتماع یابی، ابتدا با استفاده از یک رویکرد ریاضی، میزان شباهتِ صفحات وب به کمک یک سنجه شباهت (مانند جاکارد یا ضریب انطباق) و بردار ویژگی ها محاسبه و به عنوان وزن به یال های موجود بین آن ها در شبکه ی اینترنتی موردنظر افزوده می شود. با این کار عملاً یک شبکه اینترنتی ویژگی دار با یال های غیر موزون به یک شبکه بدون ویژگی با یالهای موزون تبدیل می شود. سپس با استفاده از یک مدل ریاضی (که مختص شبکه هایی با یال های موزون است)، اجتماعات موجود در این شبکه ی موزون کشف می شود. برای اعتبارسنجی و اثبات کارایی، در قالب آزمون های فرض آماری ادعاشده است که کیفیت اجتماعات کشف شده توسط رویکرد ریاضی پیشنهادی (که ویژگی های صفحات وب را لحاظ می کند) به طور آماری بهتر از مدل های ریاضی پیشین (که از ویژگی ها چشم پوشی می کند) است. نتایج آزمون های آماری روی شبکه اینترنتی واقعی نشان می دهد که مدل پیشنهادی این پژوهش در حالتی که از معیار جاکارد برای محاسبه میزان شباهت صفحات وب استفاده می کند به طور معنی داری (با P-value=0. 01) باعث کشف اجتماعاتی بهتر در قیاس با مدل های ریاضی پیشین شده است. همچنین نتایج دیگر آزمون های آماری نیز نشان می دهد که انتخاب سنجه ی شباهتِ متناسب با ماهیت شبکه، تأثیر بسزایی در میزان کیفیت رویکرد پیشنهادی دارد.