Фан Сайт сериала House M.D.

Последние сообщения

Мини-чат

Спойлеры, реклама и ссылки на другие сайты в чате запрещены

Наш опрос

По-вашему, доктор Хауз сможет вылечится от зависимости?
Всего ответов: 12395

Советуем присмотреться

Приветствую Вас Гость | RSS

[ Новые сообщения · Участники · Правила форума · FAQ · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Модератор форума: fistashka, kahlan, MarishkaM  
Форум » О сайте » Департамент Переводов » Частота употребления слов в сериале
Частота употребления слов в сериале
сайберДата: Воскресенье, 25.10.2009, 01:29 | Сообщение # 1
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 8
Карма: 0
Статус: Offline
на досуге сваял программку которая посчитала все слова из английских субтитров и посортировала их по частоте использования...

Выкладываю их тут, может это не только мне интересно...

не знаю как красивее выложить... всего слов 19000, тут первые 500 слов, если интересно выложу остальные

Quote
513648
слово количество % в общем количестве % наростающим итогом
you 22044 4,292% 4,292%
i 19986 3,891% 8,183%
the 17937 3,492% 11,675%
a 13013 2,533% 14,208%
to 12845 2,501% 16,709%
it 10573 2 ,058% 18,767%
that 6880 1,339% 20,107%
and 6697 1,304% 21,411%
of 6110 1,190% 22,600%
he 5888 1,146% 23,746%
we 5728 1,115% 24,862%
in 5291 1,030% 25,892%
is 5269 1,026% 26,917%
what 4680 0,911% 27,829%
not 4443 0,865% 28,694%
your 4340 0,845% 29,539%
she 4323 0,842% 3 0,380%
for 3954 0,770% 31,150%
no 3831 0,746% 31,896%
her 3717 0,724% 32,619%
have 3636 0,708% 33,327%
be 3575 0,696% 34,023%
can 3564 0,694% 34,717%
on 3498 0,681% 35,398%
if 3363 0,655% 36,053%
was 3310 0,644% 36,697%
do 3254 0,634% 37,331%
this 3244 0,632% 37,962%
m e 3140 0,611% 38,574%
with 2985 0,581% 39,155%
don't 2980 0,580% 39,735%
my 2905 0,566% 40,301%
just 2899 0,564% 40,865%
his 2829 0,551 % 41,416%
are 2802 0,546% 41,961%
so 2394 0,466% 42,427%
but 2373 0,462% 42,889%
get 2373 0,462% 43,351%
there 2104 0,410% 43,761%
him 2081 0,405% 44,166%
they 2060 0,401% 44,567%
know 1999 0,389% 44,956%
an 1970 0,384% 45,340%
out 1922 0,374% 45,714%
about 1895 0,369% 46,083%
all 1801 0,351% 46,434%
why 1744 0,340% 46,773%
could 1701 0,331% 47,104%
got 1700 0,331% 47,435%
or 1695 0,330% 47,765%
like 1661 0,323% 48,089%
up 1630 0,317% 48,406%
gonna 1621 0,316% 48,721%
one 1596 0,311% 49,032%
think 1592 0,310% 49,342%
how 1548 0,301% 49,644%
want 1425 0,277% 49,921%
at 1418 0,276% 50,197%
right 1374 0,267% 50,465%
need 1342 0,261% 50,726%
did 1331 0,259% 50,985%
ho use 1302 0,253% 51,238%
because 1297 0,253% 51,491%
would 1294 0,252% 51,743%
go 1214 0,236% 51,979%
didn't 1180 0,230% 52,209%
as 1160 0,226% 52,435%
from 1148 0,223% 52,658%
who 1144 0,223% 52,881%
when 1133 0,221% 53,102%
were 1120 0,218% 53,320%
had 1111 0,216% 53,5 36%
yeah 1104 0,215% 53,751%
here 1078 0,210% 53,961%
well 1046 0,204% 54,164%
doesn't 1000 0,195% 54,359%
good 954 0,186% 54,545%
now 954 0,186% 54,730%
some 949 0,185% 54,915%
tell 937 0,182% 55,098%
make 930 0,181% 55,279%
then 924 0,180% 55,459%
been 920 0,179% 55, 638%
which 919 0,179% 55,817%
going 911 0,177% 55,994%
more 908 0,177% 56,171%
has 906 0,176% 56,347%
see 888 0,173% 56,520%
back 878 0 ,171% 56,691%
something 877 0,171% 56,862%
should 872 0,170% 57,031%
take 872 0,170% 57,201%
patient 863 0,168% 57,369%
time 860 0,167% 57,537%
by 855 0,166% 57,703%
any 834 0,162% 57,866%
oh 829 0,161% 58,027%
let 824 0,160% 58,187%
two 814 0,158% 58,346%
okay 800 0,1 56% 58,502%
blood 788 0,153% 58,655%
people 775 0,151% 58,806%
only 761 0,148% 58,954%
give 754 0,147% 59,101%
heart 752 0,146% 59,247%
will 729 0,142% 59,389%
maybe 726 0,141% 59,530%
them 698 0,136% 59,666%
where 677 0,132% 59,798%
other 675 0,131% 59,930%
still 669 0 ,130% 60,060%
dr 666 0,130% 60,189%
off 666 0,130% 60,319%
us 665 0,129% 60,449%
way 664 0,129% 60,578%
never 657 0,128% 60,706%
come 6 53 0,127% 60,833%
into 642 0,125% 60,958%
means 640 0,125% 61,082%
brain 638 0,124% 61,207%
really 636 0,124% 61,331%
look 631 0,123% 6 1,453%
does 626 0,122% 61,575%
nothing 618 0,120% 61,696%
than 603 0,117% 61,813%
wrong 591 0,115% 61,928%
say 585 0,114% 62,042%
even 582 0,113% 62,155%
better 574 0,112% 62,267%
too 567 0,110% 62,377%
sure 567 0,110% 62,488%
doing 567 0,110% 62,598%
said 565 0,110% 6 2,708%
cause 554 0,108% 62,816%
little 552 0,107% 62,923%
down 552 0,107% 63,031%
find 547 0,106% 63,137%
guy 538 0,105% 63,242%
over 5 24 0,102% 63,344%
test 520 0,101% 63,445%
foreman 501 0,098% 63,543%
our 499 0,097% 63,640%
mean 497 0,097% 63,737%
before 494 0,096% 6 3,833%
pain 483 0,094% 63,927%
thing 483 0,094% 64,021%
anything 480 0,093% 64,115%
life 467 0,091% 64,205%
might 456 0,089% 64,294%
y es 441 0,086% 64,380%
thought 441 0,086% 64,466%
kid 431 0,084% 64,550%
told 422 0,082% 64,632%
put 420 0,082% 64,714%
start 418 0,081% 64,795%
being 418 0,081% 64,877%
isn't 416 0,081% 64,958%
stop 416 0,081% 65,039%
cuddy 415 0,081% 65,119%
much 414 0,081% 65,200%
ev erything 411 0,080% 65,280%
talk 411 0,080% 65,360%
work 411 0,080% 65,440%
cancer 407 0,079% 65,519%
keep 405 0,079% 65,598%
last 403 0 ,078% 65,676%
feel 403 0,078% 65,755%
wouldn 398 0,077% 65,832%
bad 392 0,076% 65,909%
their 391 0,076% 65,985%
getting 384 0,075% 66,0 60%
else 381 0,074% 66,134%
new 381 0,074% 66,208%
chase 378 0,074% 66,282%
hey 378 0,074% 66,355%
call 377 0,073% 66,429%
someone 376 0,073% 66,502%
wasn't 367 0,071% 66,573%
sorry 363 0,071% 66,644%
another 363 0,071% 66,715%
help 363 0,071% 66,785%
three 362 0,070% 6 6,856%
actually 356 0,069% 66,925%
every 353 0,069% 66,994%
won 351 0,068% 67,062%
fine 349 0,068% 67,130%
liver 348 0,068% 67,198%
am 348 0,068% 67,266%
first 347 0,068% 67,333%
care 345 0,067% 67,400%
also 343 0,067% 67,467%
problem 342 0,067% 67,534%
either 341 0,06 6% 67,600%
cameron 336 0,065% 67,665%
those 335 0,065% 67,731%
god 334 0,065% 67,796%
through 334 0,065% 67,861%
things 333 0,065% 67,9 26%
love 333 0,065% 67,990%
doctor 333 0,065% 68,055%
long 332 0,065% 68,120%
years 331 0,064% 68,184%
these 315 0,061% 68,246%
case 3 14 0,061% 68,307%
always 313 0,061% 68,368%
after 311 0,061% 68,428%
infection 311 0,061% 68,489%
kill 310 0,060% 68,549%
symptoms 308 0 ,060% 68,609%
trying 308 0,060% 68,669%
made 306 0,060% 68,729%
already 302 0,059% 68,787%
very 301 0,059% 68,846%
makes 299 0,058% 68, 904%
again 298 0,058% 68,962%
without 297 0,058% 69,020%
enough 296 0,058% 69,078%
probably 294 0,057% 69,135%
same 293 0,057% 69,192%
h ome 292 0,057% 69,249%
gotta 290 0,056% 69,305%
lot 290 0,056% 69,362%
wanna 287 0,056% 69,418%
away 284 0,055% 69,473%
day 284 0,055% 6 9,528%
left 282 0,055% 69,583%
thank 281 0,055% 69,638%
great 279 0,054% 69,692%
job 279 0,054% 69,746%
wilson 277 0,054% 69,800%
drug s 276 0,054% 69,854%
mom 275 0,054% 69,908%
reason 275 0,054% 69,961%
sick 271 0,053% 70,014%
talking 270 0,053% 70,066%
treatment 268 0 ,052% 70,119%
hours 267 0,052% 70,171%
around 267 0,052% 70,223%
next 266 0,052% 70,274%
hospital 265 0,052% 70,326%
wanted 264 0,051% 7 0,377%
big 264 0,051% 70,429%
biopsy 260 0,051% 70,479%
gave 258 0,050% 70,530%
wait 257 0,050% 70,580%
check 257 0,050% 70,630%
norma l 256 0,050% 70,680%
tests 251 0,049% 70,728%
die 251 0,049% 70,777%
wants 249 0,048% 70,826%
head 249 0,048% 70,874%
both 249 0,048% 7 0,923%
body 248 0,048% 70,971%
kind 247 0,048% 71,019%
few 245 0,048% 71,067%
looking 243 0,047% 71,114%
run 242 0,047% 71,161%
caused 241 0,047% 71,208%
ever 241 0,047% 71,255%
ago 240 0,047% 71,302%
since 240 0,047% 71,348%
lungs 240 0,047% 71,395%
room 239 0,047% 71 ,442%
while 239 0,047% 71,488%
night 238 0,046% 71,535%
surgery 236 0,046% 71,581%
having 236 0,046% 71,626%
guys 236 0,046% 71,672%
h aven 234 0,046% 71,718%
nice 234 0,046% 71,764%
must 231 0,045% 71,809%
medical 231 0,045% 71,853%
tumor 230 0,045% 71,898%
aren't 230 0 ,045% 71,943%
unless 230 0,045% 71,988%
until 230 0,045% 72,033%
found 229 0,045% 72,077%
says 227 0,044% 72,121%
man 225 0,044% 72,165 %
went 220 0,043% 72,208%
ask 220 0,043% 72,251%
done 220 0,043% 72,294%
needs 213 0,041% 72,335%
pretty 212 0,041% 72,376%
hand 212 0 ,041% 72,418%
point 212 0,041% 72,459%
believe 212 0,041% 72,500%
dad 211 0,041% 72,541%
uh 209 0,041% 72,582%
most 208 0,040% 72,622%
b aby 208 0,040% 72,663%
own 207 0,040% 72,703%
wife 206 0,040% 72,743%
dead 206 0,040% 72,784%
idea 205 0,040% 72,823%
looks 205 0,040% 7 2,863%
try 204 0,040% 72,903%
stuff 204 0,040% 72,943%
negative 204 0,040% 72,982%
gets 204 0,040% 73,022%
real 204 0,040% 73,062%
old 202 0,039% 73,101%
happened 202 0,039% 73,141%
son 202 0,039% 73,180%
took 201 0,039% 73,219%
whatever 200 0,039% 73,258%
leave 199 0, 039% 73,297%
parents 199 0,039% 73,335%
doctors 198 0,039% 73,374%
use 194 0,038% 73,412%
six 192 0,037% 73,449%
please 191 0,037% 73,4 86%
figure 191 0,037% 73,524%
lie 190 0,037% 73,560%
system 190 0,037% 73,597%
making 189 0,037% 73,634%
minutes 187 0,036% 73,671%
ob viously 186 0,036% 73,707%
came 185 0,036% 73,743%
dying 184 0,036% 73,779%
disease 183 0,036% 73,814%
explain 183 0,036% 73,850%
show 1 82 0,035% 73,885%
yourself 181 0,035% 73,921%
save 181 0,035% 73,956%
used 178 0,035% 73,991%
months 177 0,034% 74,025%
taking 177 0,03 4% 74,059%
patients 176 0,034% 74,094%
knew 176 0,034% 74,128%
hear 174 0,034% 74,162%
whole 174 0,034% 74,196%
saying 173 0,034% 74,22 9%
days 173 0,034% 74,263%
treat 173 0,034% 74,297%
many 171 0,033% 74,330%
woman 171 0,033% 74,363%
four 170 0,033% 74,396%
five 170 0 ,033% 74,430%
fever 170 0,033% 74,463%
hurt 169 0,033% 74,496%
best 168 0,033% 74,528%
stay 168 0,033% 74,561%
guess 168 0,033% 74,594%
hell 168 0,033% 74,626%
exactly 165 0,032% 74,659%
couldn 163 0,032% 74,690%
mri 163 0,032% 74,722%
cut 162 0,032% 74,754%
supposed 1 62 0,032% 74,785%
happy 161 0,031% 74,816%
sex 161 0,031% 74,848%
pills 160 0,031% 74,879%
drug 160 0,031% 74,910%
question 159 0,031% 7 4,941%
answer 159 0,031% 74,972%
clean 158 0,031% 75,003%
except 158 0,031% 75,033%
lung 158 0,031% 75,064%
high 157 0,031% 75,095%
pl ace 157 0,031% 75,125%
called 157 0,031% 75,156%
almost 156 0,030% 75,186%
hold 156 0,030% 75,217%
least 156 0,030% 75,247%
kids 155 0, 030% 75,277%
change 155 0,030% 75,307%
sleep 154 0,030% 75,337%
bleeding 154 0,030% 75,367%
explains 153 0,030% 75,397%
less 152 0,030% 75,427%
knows 152 0,030% 75,456%
different 152 0,030% 75,486%
shut 152 0,030% 75,516%
asked 151 0,029% 75,545%
started 151 0,029% 75,5 74%
chance 151 0,029% 75,604%
girl 151 0,029% 75,633%
live 151 0,029% 75,663%
death 151 0,029% 75,692%
everyone 150 0,029% 75,721%
mov e 149 0,029% 75,750%
working 149 0,029% 75,779%
course 149 0,029% 75,808%
second 148 0,029% 75,837%
diagnosis 148 0,029% 75,866%
goes 1 48 0,029% 75,895%
mind 148 0,029% 75,923%
may 148 0,029% 75,952%
person 148 0,029% 75,981%
symptom 148 0,029% 76,010%
causes 148 0,029% 76,039%
hard 147 0,029% 76,067%
thanks 147 0,029% 76,096%
worse 147 0,029% 76,125%
trust 146 0,028% 76,153%
play 145 0,028% 76,181%
p ressure 144 0,028% 76,209%
able 144 0,028% 76,237%
coming 143 0,028% 76,265%
name 143 0,028% 76,293%
saw 143 0,028% 76,321%
open 142 0, 028% 76,348%
history 142 0,028% 76,376%
shouldn 140 0,027% 76,403%
anyone 140 0,027% 76,431%
part 140 0,027% 76,458%
leg 140 0,027% 76, 485%
money 140 0,027% 76,512%
yet 140 0,027% 76,540%
kidney 140 0,027% 76,567%
fact 139 0,027% 76,594%
once 139 0,027% 76,621%
husband 139 0,027% 76,648%
medicine 139 0,027% 76,675%
sign 138 0,027% 76,702%
turn 138 0,027% 76,729%
assume 137 0,027% 76,755%
phone 137 0,0 27% 76,782%
white 137 0,027% 76,809%
mother 137 0,027% 76,835%
sense 136 0,026% 76,862%
fire 136 0,026% 76,888%
school 135 0,026% 76,91 5%
team 134 0,026% 76,941%
side 133 0,026% 76,967%
world 133 0,026% 76,993%
week 132 0,026% 77,018%
family 132 0,026% 77,044%
cells 13 1 0,026% 77,070%
seen 130 0,025% 77,095%
damn 130 0,025% 77,120%
clear 129 0,025% 77,145%
morning 128 0,025% 77,170%
telling 128 0,025% 77,195%
car 128 0,025% 77,220%
damage 127 0,025% 77,245%
completely 126 0,025% 77,269%
news 126 0,025% 77,294%
under 125 0,024% 77,318 %
somebody 125 0,024% 77,342%
rest 125 0,024% 77,367%
year 124 0,024% 77,391%
ass 124 0,024% 77,415%
deal 124 0,024% 77,439%
feeling 1 23 0,024% 77,463%
thinks 123 0,024% 77,487%
antibiotics 123 0,024% 77,511%
font 122 0,024% 77,535%
couple 121 0,024% 77,558%
clinic 119 0,023% 77,582%
thinking 119 0,023% 77,605%
screwed 119 0,023% 77,628%
matter 119 0,023% 77,651%
end 119 0,023% 77,674%
half 118 0,023% 77,697%
interesting 118 0,023% 77,720%
hate 117 0,023% 77,743%
hasn 117 0,023% 77,766%
lying 117 0,023% 77,788%
instead 116 0,023% 77, 811%
hi 116 0,023% 77,834%
hope 115 0,022% 77,856%
clot 115 0,022% 77,878%
everybody 115 0,022% 77,901%
died 115 0,022% 77,923%
rate 1 15 0,022% 77,946%
failure 115 0,022% 77,968%
seizure 114 0,022% 77,990%
lied 114 0,022% 78,012%
soon 114 0,022% 78,035%
likely 114 0,02 2% 78,057%
giving 113 0,022% 78,079%
times 113 0,022% 78,101%
hit 112 0,022% 78,123%
problems 112 0,022% 78,144%
office 111 0,022% 78,1 66%
figured 111 0,022% 78,188%
hour 110 0,021% 78,209%
wow 109 0,021% 78,230%
sometimes 109 0,021% 78,251%
brother 109 0,021% 78,273%
b one 108 0,021% 78,294%
send 108 0,021% 78,315%
water 108 0,021% 78,336%
control 108 0,021% 78,357%
meds 107 0,021% 78,378%
eyes 106 0,0 21% 78,398%
happen 106 0,021% 78,419%
break 106 0,021% 78,440%
human 106 0,021% 78,460%
set 105 0,020% 78,481%
each 105 0,020% 78,501%
s mall 105 0,020% 78,521%
weren 105 0,020% 78,542%
lost 105 0,020% 78,562%
muscle 105 0,020% 78,583%
heard 105 0,020% 78,603%


Сообщение отредактировал сайбер - Воскресенье, 25.10.2009, 01:30
 
house-mdnetДата: Воскресенье, 25.10.2009, 04:00 | Сообщение # 2
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 8
Карма: 26
Статус: Offline
Волчанки нет в этом списке, а было бы интересно...
19 тысяч слов всего? А можно их в файлик и ссылку тут?
 
klon_2000Дата: Воскресенье, 25.10.2009, 18:16 | Сообщение # 3
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 9
Карма: 0
Статус: Offline
спасибо))
а можно продолжить выкладывать список
 
сайберДата: Воскресенье, 25.10.2009, 22:58 | Сообщение # 4
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 8
Карма: 0
Статус: Offline
2-ые 500 слов
Quote

sounds 105 0,020% 78,624%
eye 105 0,020% 78,644%
pick 104 0,020% 78,664%
scan 104 0,020% 78,685%
listen 104 0,020% 78,705%
skin 103 0 ,020% 78,725%
cool 103 0,020% 78,745%
full 103 0,020% 78,765%
kidneys 103 0,020% 78,785%
chest 103 0,020% 78,805%
low 103 0,020% 78,825 %
killed 103 0,020% 78,845%
syndrome 102 0,020% 78,865%
fix 102 0,020% 78,885%
steroids 102 0,020% 78,905%
forget 101 0,020% 78,924%
s hot 101 0,020% 78,944%
kutner 101 0,020% 78,964%
weeks 100 0,019% 78,983%
lab 99 0,019% 79,003%
friend 99 0,019% 79,022%
red 99 0,019% 7 9,041%
rash 99 0,019% 79,060%
close 98 0,019% 79,079%
results 98 0,019% 79,099%
father 98 0,019% 79,118%
mr 98 0,019% 79,137%
remember 98 0,019% 79,156%
walk 97 0,019% 79,175%
watch 97 0,019% 79,194%
none 97 0,019% 79,212%
nurse 97 0,019% 79,231%
immune 97 0,019% 79,25 0%
fun 97 0,019% 79,269%
usually 97 0,019% 79,288%
count 96 0,019% 79,307%
boy 96 0,019% 79,325%
between 95 0,018% 79,344%
read 95 0,0 18% 79,362%
killing 95 0,018% 79,381%
gone 95 0,018% 79,399%
stupid 94 0,018% 79,418%
ct 94 0,018% 79,436%
hair 94 0,018% 79,454%
door 93 0,018% 79,472%
comes 93 0,018% 79,490%
sort 93 0,018% 79,509%
crap 93 0,018% 79,527%
attack 93 0,018% 79,545%
stomach 93 0,018% 79, 563%
game 92 0,018% 79,581%
reaction 92 0,018% 79,599%
bring 92 0,018% 79,617%
showed 92 0,018% 79,634%
fast 92 0,018% 79,652%
apparen tly 92 0,018% 79,670%
confirm 92 0,018% 79,688%
transplant 92 0,018% 79,706%
today 91 0,018% 79,724%
theory 91 0,018% 79,742%
asking 91 0,018% 79,759%
tested 91 0,018% 79,777%
checked 91 0,018% 79,795%
drink 91 0,018% 79,812%
arm 91 0,018% 79,830%
coma 91 0,018% 79,848%
its 90 0,018% 79,865%
playing 90 0,018% 79,883%
healthy 90 0,018% 79,900%
excuse 90 0,018% 79,918%
marrow 90 0,018% 79,935%
screw 89 0 ,017% 79,953%
ready 89 0,017% 79,970%
given 89 0,017% 79,987%
together 89 0,017% 80,005%
needed 89 0,017% 80,022%
takes 89 0,017% 80,03 9%
black 88 0,017% 80,057%
alone 88 0,017% 80,074%
truth 88 0,017% 80,091%
seem 87 0,017% 80,108%
lose 87 0,017% 80,125%
running 87 0, 017% 80,142%
inside 87 0,017% 80,159%
miserable 86 0,017% 80,175%
friends 86 0,017% 80,192%
eight 86 0,017% 80,209%
cell 86 0,017% 80,2 26%
idiot 85 0,017% 80,242%
outside 85 0,017% 80,259%
anybody 85 0,017% 80,275%
urine 85 0,017% 80,292%
ten 85 0,017% 80,308%
number 8 4 0,016% 80,325%
neurological 84 0,016% 80,341%
face 83 0,016% 80,357%
personal 83 0,016% 80,373%
possible 83 0,016% 80,389%
mark 83 0, 016% 80,406%
bleed 83 0,016% 80,422%
autoimmune 82 0,016% 80,438%
nerve 82 0,016% 80,454%
cardiac 82 0,016% 80,470%
bit 81 0,016% 80,48 5%
perfect 81 0,016% 80,501%
seems 80 0,016% 80,517%
waiting 80 0,016% 80,532%
far 80 0,016% 80,548%
sound 80 0,016% 80,564%
miss 80 0 ,016% 80,579%
allergic 80 0,016% 80,595%
breathing 80 0,016% 80,610%
stick 80 0,016% 80,626%
myself 80 0,016% 80,641%
daughter 80 0,016 % 80,657%
eat 79 0,015% 80,672%
easy 79 0,015% 80,688%
positive 78 0,015% 80,703%
choice 78 0,015% 80,718%
afraid 78 0,015% 80,733%
tr auma 78 0,015% 80,748%
bed 78 0,015% 80,764%
till 78 0,015% 80,779%
brought 77 0,015% 80,794%
missed 77 0,015% 80,809%
lives 77 0,015% 8 0,824%
cure 77 0,015% 80,839%
longer 77 0,015% 80,854%
amber 77 0,015% 80,869%
handle 77 0,015% 80,884%
happens 76 0,015% 80,899%
cond ition 76 0,015% 80,913%
stand 76 0,015% 80,928%
prove 76 0,015% 80,943%
worked 76 0,015% 80,958%
whoa 76 0,015% 80,973%
worry 75 0,015% 80,987%
sit 75 0,015% 81,002%
hands 75 0,015% 81,016%
hurts 75 0,015% 81,031%
tried 75 0,015% 81,046%
seriously 75 0,015% 81,060%
aga inst 74 0,014% 81,075%
nobody 74 0,014% 81,089%
important 74 0,014% 81,103%
remove 74 0,014% 81,118%
crazy 73 0,014% 81,132%
works 73 0 ,014% 81,146%
type 73 0,014% 81,160%
women 73 0,014% 81,175%
true 73 0,014% 81,189%
boss 73 0,014% 81,203%
nope 72 0,014% 81,217%
cat 7 2 0,014% 81,231%
lupus 72 0,014% 81,245%
food 71 0,014% 81,259%
vicodin 71 0,014% 81,273%
minute 71 0,014% 81,287%
causing 71 0,014% 81 ,300%
throat 71 0,014% 81,314%
order 71 0,014% 81,328%
date 71 0,014% 81,342%
cold 70 0,014% 81,356%
buy 70 0,014% 81,369%
tomorrow 70 0,014% 81,383%
understand 70 0,014% 81,396%
absolutely 69 0,013% 81,410%
free 69 0,013% 81,423%
looked 69 0,013% 81,437%
child 69 0,01 3% 81,450%
fight 69 0,013% 81,464%
com 69 0,013% 81,477%
saved 69 0,013% 81,490%
stopped 68 0,013% 81,504%
late 68 0,013% 81,517%
seco nds 68 0,013% 81,530%
dog 68 0,013% 81,543%
toxins 68 0,013% 81,557%
difference 68 0,013% 81,570%
rule 68 0,013% 81,583%
waste 68 0,013 % 81,596%
risk 68 0,013% 81,610%
himself 68 0,013% 81,623%
hang 68 0,013% 81,636%
worried 67 0,013% 81,649%
based 67 0,013% 81,662%
be t 67 0,013% 81,675%
tox 67 0,013% 81,688%
rules 66 0,013% 81,701%
scared 66 0,013% 81,714%
mistake 66 0,013% 81,727%
air 66 0,013% 81,7 40%
state 66 0,013% 81,752%
anymore 66 0,013% 81,765%
questions 66 0,013% 81,778%
taub 66 0,013% 81,791%
seizures 65 0,013% 81,804%
se eing 65 0,013% 81,816%
neck 65 0,013% 81,829%
relax 65 0,013% 81,842%
wearing 65 0,013% 81,854%
trouble 65 0,013% 81,867%
bus 65 0,013% 81,880%
um 65 0,013% 81,892%
during 65 0,013% 81,905%
living 65 0,013% 81,918%
ones 65 0,013% 81,930%
infections 65 0,013% 81,943%
pu lmonary 65 0,013% 81,956%
sleeping 65 0,013% 81,968%
screen 65 0,013% 81,981%
word 64 0,012% 81,993%
sent 64 0,012% 82,006%
yesterday 6 4 0,012% 82,018%
nose 64 0,012% 82,031%
lawyer 64 0,012% 82,043%
wake 64 0,012% 82,056%
poisoning 64 0,012% 82,068%
fired 64 0,012% 82, 081%
deep 63 0,012% 82,093%
treating 63 0,012% 82,105%
starts 63 0,012% 82,117%
definitely 63 0,012% 82,130%
file 63 0,012% 82,142%
di sorder 63 0,012% 82,154%
thirteen 63 0,012% 82,166%
plus 62 0,012% 82,178%
later 62 0,012% 82,191%
spend 62 0,012% 82,203%
such 62 0,01 2% 82,215%
weird 62 0,012% 82,227%
arrest 62 0,012% 82,239%
dangerous 62 0,012% 82,251%
along 61 0,012% 82,263%
fluid 61 0,012% 82,275%
rather 61 0,012% 82,287%
protein 61 0,012% 82,298%
girlfriend 61 0,012% 82,310%
likes 61 0,012% 82,322%
radiation 61 0,012% 82,334%
m outh 61 0,012% 82,346%
fits 61 0,012% 82,358%
married 61 0,012% 82,370%
business 61 0,012% 82,382%
starting 61 0,012% 82,393%
neither 6 1 0,012% 82,405%
touch 61 0,012% 82,417%
fat 61 0,012% 82,429%
calling 61 0,012% 82,441%
issue 60 0,012% 82,453%
surgeon 60 0,012% 82,4 64%
genetic 60 0,012% 82,476%
ah 60 0,012% 82,488%
near 60 0,012% 82,499%
tumors 60 0,012% 82,511%
floor 60 0,012% 82,523%
line 60 0,0 12% 82,534%
machine 60 0,012% 82,546%
met 60 0,012% 82,558%
feels 60 0,012% 82,569%
decision 59 0,011% 82,581%
hot 59 0,011% 82,592%
l oss 59 0,011% 82,604%
relationship 59 0,011% 82,615%
month 59 0,011% 82,627%
light 59 0,011% 82,638%
push 59 0,011% 82,650%
testing 59 0 ,011% 82,661%
honey 59 0,011% 82,673%
ruled 59 0,011% 82,684%
front 59 0,011% 82,696%
top 58 0,011% 82,707%
clots 58 0,011% 82,718%
su ddenly 58 0,011% 82,730%
known 58 0,011% 82,741%
somewhere 58 0,011% 82,752%
hiding 58 0,011% 82,763%
twice 58 0,011% 82,775%
board 58 0 ,011% 82,786%
plan 58 0,011% 82,797%
stacy 58 0,011% 82,809%
expect 57 0,011% 82,820%
simple 57 0,011% 82,831%
oxygen 57 0,011% 82,842%
lucky 57 0,011% 82,853%
cares 57 0,011% 82,864%
become 57 0,011% 82,875%
power 57 0,011% 82,886%
sister 57 0,011% 82,897%
behind 57 0 ,011% 82,909%
secret 57 0,011% 82,920%
mine 56 0,011% 82,931%
breath 56 0,011% 82,941%
third 56 0,011% 82,952%
quit 56 0,011% 82,963%
s tress 56 0,011% 82,974%
daddy 56 0,011% 82,985%
feet 56 0,011% 82,996%
fingers 56 0,011% 83,007%
procedure 56 0,011% 83,018%
function 5 5 0,011% 83,028%
story 55 0,011% 83,039%
worth 55 0,011% 83,050%
common 55 0,011% 83,061%
losing 55 0,011% 83,071%
wish 55 0,011% 83,08 2%
young 55 0,011% 83,093%
pay 55 0,011% 83,103%
kiss 55 0,011% 83,114%
crash 55 0,011% 83,125%
leaves 55 0,011% 83,136%
level 54 0,01 1% 83,146%
respiratory 54 0,011% 83,157%
piece 54 0,011% 83,167%
opinion 54 0,011% 83,178%
yours 54 0,011% 83,188%
hadn 54 0,011% 83,19 9%
safe 54 0,011% 83,209%
paralysis 54 0,011% 83,220%
list 54 0,011% 83,230%
moving 54 0,011% 83,241%
past 53 0,010% 83,251%
admit 53 0 ,010% 83,261%
lead 53 0,010% 83,272%
sample 53 0,010% 83,282%
throw 53 0,010% 83,292%
differential 53 0,010% 83,303%
excellent 53 0,010 % 83,313%
christmas 53 0,010% 83,323%
dies 53 0,010% 83,334%
x-ray 53 0,010% 83,344%
protect 53 0,010% 83,354%
consent 53 0,010% 83,364 %
step 53 0,010% 83,375%
pull 53 0,010% 83,385%
pneumonia 53 0,010% 83,395%
i’m 53 0,010% 83,406%
stroke 52 0,010% 83,416%
putting 52 0 ,010% 83,426%
write 52 0,010% 83,436%
abdominal 52 0,010% 83,446%
moved 52 0,010% 83,456%
saving 52 0,010% 83,466%
ran 52 0,010% 83,477 %
men 52 0,010% 83,487%
anywhere 52 0,010% 83,497%
forgot 52 0,010% 83,507%
donor 52 0,010% 83,517%
extra 51 0,010% 83,527%
bathroom 5 1 0,010% 83,537%
anyway 51 0,010% 83,547%
evidence 51 0,010% 83,557%
easier 51 0,010% 83,567%
tells 51 0,010% 83,577%
children 51 0,010 % 83,587%
stuck 51 0,010% 83,597%
broke 51 0,010% 83,606%
treated 51 0,010% 83,616%
milligrams 51 0,010% 83,626%
tissue 51 0,010% 83,63 6%
fall 51 0,010% 83,646%
legs 51 0,010% 83,656%
interested 50 0,010% 83,666%
hmm 50 0,010% 83,676%
serious 50 0,010% 83,685%
cutting 5 0 0,010% 83,695%
pants 50 0,010% 83,705%
echo 50 0,010% 83,715%
using 50 0,010% 83,724%
busy 50 0,010% 83,734%
caught 50 0,010% 83,744%
funny 50 0,010% 83,753%
medication 50 0,010% 83,763%
smell 50 0,010% 83,773%
notice 50 0,010% 83,783%
meet 50 0,010% 83,792%
cases 50 0,010% 83,802%
shows 50 0,010% 83,812%
taken 50 0,010% 83,822%
alcohol 50 0,010% 83,831%
gives 50 0,010% 83,841%
though 49 0,010% 83,8 51%
barely 49 0,010% 83,860%
ice 49 0,010% 83,870%
needle 49 0,010% 83,879%
changes 49 0,010% 83,889%
coffee 49 0,010% 83,898%
health 4 9 0,010% 83,908%
realize 49 0,010% 83,917%
tv 49 0,010% 83,927%
flow 49 0,010% 83,936%
jerk 49 0,010% 83,946%
multiple 49 0,010% 83,956 %
meant 49 0,010% 83,965%
turned 49 0,010% 83,975%
moment 48 0,009% 83,984%
music 48 0,009% 83,993%
sitting 48 0,009% 84,003%
age 48 0 ,009% 84,012%
changed 48 0,009% 84,021%
records 48 0,009% 84,031%
watching 48 0,009% 84,040%
avoid 48 0,009% 84,049%
bucks 48 0,009% 84 ,059%
department 48 0,009% 84,068%
huh 48 0,009% 84,077%
loves 48 0,009% 84,087%
explanation 48 0,009% 84,096%
temperature 48 0,009% 84 ,105%
accident 48 0,009% 84,115%
cover 48 0,009% 84,124%
guilt 48 0,009% 84,133%
hep 48 0,009% 84,143%
girls 48 0,009% 84,152%
monitor 48 0,009% 84,162%
lp 48 0,009% 84,171%
er 48 0,009% 84,180%
it’s 48 0,009% 84,190%
fake 47 0,009% 84,199%
heavy 47 0,009% 84,208%
kep t 47 0,009% 84,217%
hire 47 0,009% 84,226%
bitch 47 0,009% 84,235%
hello 47 0,009% 84,244%
bacteria 47 0,009% 84,254%
dinner 47 0,009% 8 4,263%
poison 47 0,009% 84,272%
artery 47 0,009% 84,281%
often 46 0,009% 84,290%
issues 46 0,009% 84,299%
book 46 0,009% 84,308%
eleva ted 46 0,009% 84,317%
rare 46 0,009% 84,326%
respect 46 0,009% 84,335%
grow 46 0,009% 84,344%
hired 46 0,009% 84,353%
single 46 0,009% 8 4,362%
pulse 46 0,009% 84,371%
certainly 46 0,009% 84,380%
weight 46 0,009% 84,389%
organs 46 0,009% 84,397%
keeping 46 0,009% 84,406%
p et 46 0,009% 84,415%
pee 46 0,009% 84,424%
drunk 46 0,009% 84,433%
wonder 45 0,009% 84,442%
regular 45 0,009% 84,451%
ofcourse 45 0,009 % 84,460%
meningitis 45 0,009% 84,468%
wear 45 0,009% 84,477%
perfectly 45 0,009% 84,486%
drop 45 0,009% 84,495%
fit 45 0,009% 84,503%
w in 45 0,009% 84,512%
swelling 45 0,009% 84,521%
felt 45 0,009% 84,530%
party 45 0,009% 84,538%
lunch 45 0,009% 84,547%
ow 45 0,009% 84, 556%
lack 44 0,009% 84,565%
gotten 44 0,009% 84,573%
building 44 0,009% 84,582%
slow 44 0,009% 84,590%
bp 44 0,009% 84,599%
pancreas 4 4 0,009% 84,607%
ideas 44 0,009% 84,616%
em 44 0,009% 84,624%
basically 44 0,009% 84,633%
apartment 44 0,009% 84,642%
bowel 44 0,009% 8 4,650%
vision 44 0,009% 84,659%
act 44 0,009% 84,667%
original 44 0,009% 84,676%
table 44 0,009% 84,684%
present 43 0,008% 84,693%
wor ds 43 0,008% 84,701%
brilliant 43 0,008% 84,710%
early 43 0,008% 84,718%
thyroid 43 0,008% 84,726%
annoying 43 0,008% 84,735%
attention 43 0,008% 84,743%
spent 43 0,008% 84,751%
blue 43 0,008% 84,760%
broken 43 0,008% 84,768%
severe 43 0,008% 84,777%
jersey 43 0,008% 84 ,785%
insane 43 0,008% 84,793%
holding 43 0,008% 84,802%
faster 43 0,008% 84,810%
lobe 43 0,008% 84,818%
force 43 0,008% 84,827%
signs 43 0,008% 84,835%
conversation 43 0,008% 84,844%
cop 43 0,008% 84,852%
lymph 43 0,008% 84,860%
unfortunately 42 0,008% 84,868%
iv 42 0 ,008% 84,877%
proof 42 0,008% 84,885%
advice 42 0,008% 84,893%
shoes 42 0,008% 84,901%
clotting 42 0,008% 84,909%
tired 42 0,008% 84,91 7%

зная всего лишь тысячу слов можно понять 85% всего !!!!

 
dronomanДата: Воскресенье, 25.10.2009, 23:28 | Сообщение # 5
сНежный
Награды: 0

Группа: Персонал больницы
Сообщений: 1220
Карма: 326
Статус: Offline
выкладывай, конечно

Quote (сайбер)
зная всего лишь тысячу слов можно понять 85% всего !!!!

статистика вещь такая.... эта самая тысяча она может и самая употребляемая, но даст понять меньше 40% содержания, потому как важны ещё и коллокейшены, идиомы, прочие формы


 
сайберДата: Среда, 28.10.2009, 00:25 | Сообщение # 6
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 8
Карма: 0
Статус: Offline
Да, но если не знать этих и слов то будет понятно еще меньше )))

такой список полезен для того чтобы определить какое слово выучить раньше, а какое позже - начинать логичнее с более употребимых слов

Добавлено (26.10.2009, 09:49)
---------------------------------------------

Quote
Волчанки нет в этом списке, а было бы интересно...
19 тысяч слов всего? А можно их в файлик и ссылку тут?

можно, но лучше пиши в личку а то меня тут уже в спаме обвиняют ))

а волчанка есть в второй пятисотке слов

Добавлено (28.10.2009, 00:25)
---------------------------------------------
да , забыл сказать - в список попали слова со всех серий сезонов 1-5

Сообщение отредактировал сайбер - Понедельник, 26.10.2009, 09:57
 
aleksa_castleДата: Среда, 28.10.2009, 01:27 | Сообщение # 7
Диагност
Награды: 1

Группа: Персонал больницы
Сообщений: 12991
Карма: 24048
Статус: Offline
Quote (сайбер)
такой список полезен для того чтобы определить какое слово выучить раньше, а какое позже - начинать логичнее с более употребимых слов

blink сомнительно, что этот список может кому то в чем то помочь. Только если сразу с переводом tongue Большинство слов английского языка мультизначны. я уже молчу о предлогах, артиклях и вспомогательных глаголах, которые возглавляют "статистику".
И с каких это пор пятый сезон считается последним? Смысл в статистике, если сериал до сих пор идет? Пересчитывать каждый сезон заново и "сенсационные результаты" в новую тему? smile


Ушла в себя и заблудилась (с)
 
House@GodДата: Среда, 28.10.2009, 07:05 | Сообщение # 8
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 7
Карма: 0
Статус: Offline
Смешной список )). Число после слова это сколько оно в сериале встречаеться? странно например
nurse 97 0,019% 79,231% ,vicodin 71 0,014% 81,273%,lupus 72 0,014% 81,245%, мне казалось что сестру то они не по разу в каждой серии кричат, а идиотов меньше было и получаеться что волчанку они склоняют чаще чем викодин. Мне понравилось, разница в прямом подсчете и в ощущениях от количества данных понятих в сериале.
 
сайберДата: Среда, 28.10.2009, 13:54 | Сообщение # 9
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 8
Карма: 0
Статус: Offline
Я тут не претендую на абсолютную полезность списка слов для всех заглядывающих в эту тему и тем более вообще для всех людей во вселенной.
Это скажем так пища для ума для тех кому это интересно, для тех кто любит играть со словами.

Допустим я лично в первой тысяче слов нашел для себя одно незнакомое слово - thyroid.

Во второй тысяче незнакомых или сомнительных слов оказалось уже 50 - тоже в основном медицинские термины и имена. Тысяча слов занимает примерно две страницы текста в ворде при полном заполнении страницы, т.е. прочитать такое количество слов и отметить незнакомые слова можно очень быстро - ну максимум 10 минут я думаю.

Статистически первая тысяча слов списка составляет 85% всех слов сериала, первые две тысячи - 90% всех слов сериала. Т.е. выучив дополнительные 50 слов я лично обеспечиваю уверенное понимание еще 5% слов сериала. Ну разве это не прекрасно? smile

Quote

И с каких это пор пятый сезон считается последним? Смысл в статистике, если сериал до сих пор идет?

я не преследую цель чтобы список включал в себя ВСЕ слова сериала с учетом самых последних (и будующих) серий - я могу это сделать просто добавив тесты их субтитров в каталог из котрого программа берет тексты для обработки - но не хочу т.к. врядли это серьезно изменит список.

Quote

Пересчитывать каждый сезон заново и "сенсационные результаты" в новую тему?

отличная мысль smile .заявка принята . или я могу дать вам программу для подсчета - развлечетесь на досуге ))). я понимаю что вы не будете этого делать но все равно спасибо за поддержку wink

Quote

странно например
nurse 97 0,019% 79,231% ,vicodin 71 0,014% 81,273%,lupus 72 0,014% 81,245%, мне казалось что сестру то они не по разу в каждой серии кричат, а идиотов меньше было и получаеться что волчанку они склоняют чаще чем викодин.

угу, странно, тут вы правы.. правда кроме nurse есть еще слово nurses, которое встечается 42 раза. всего 97+42=139 раз. в выборку вошло 113 серий т.е. в среднем сестру зовут все равно только по разу в каждой серии )))

а слово idiot встречается 85 раз, idiots -30, 85+30=115
т.е. опять вы правы - "идиотов меньше было" чем медсестер )))

легкого и стопроцентно правильного способа убрать такие повторы (как nurse и nurses ) и прочий "мусор" нет, поэтому я даже не брался за это. вообще повторов довольно много - думаю процентов 10% из всего списка

у меня список слов находится в файле .xls, и можно легко видеть такие вещи отбирая слова по фильтру

а lupus дествительно втречается только 72 раза

Если у кого то есть еще какие-то мнения как еще можно изучать английский с помощью сериала Хаус - я как автор темы призываю вас поделиться своими мыслями по этому поводу. smile

Сообщение отредактировал сайбер - Среда, 28.10.2009, 14:09
 
aleksa_castleДата: Среда, 28.10.2009, 16:01 | Сообщение # 10
Диагност
Награды: 1

Группа: Персонал больницы
Сообщений: 12991
Карма: 24048
Статус: Offline
Quote (сайбер)
я могу это сделать просто добавив тесты их субтитров в каталог из котрого программа берет тексты для обработки - но не хочу т.к. врядли это серьезно изменит список.

ммм...а еще..а еще...можно посчитать статистику переведенных субтитров happy
Quote (сайбер)
или я могу дать вам программу для подсчета - развлечетесь на досуге )))

спасибо, но я знаю как скрасить свой досуг smile
Quote (сайбер)
угу, странно, тут вы правы.. правда кроме nurse есть еще слово nurses, которое встечается 42 раза. всего 97+42=139 раз. в выборку вошло 113 серий т.е. в среднем сестру зовут все равно только по разу в каждой серии )))

да, кстати, считать множественное и единственное число одной формы существительного тоже не рационально для изучения))
Quote (сайбер)
Если у кого то есть еще какие-то мнения как еще можно изучать английский с помощью сериала Хаус - я как автор темы призываю вас поделиться своими мыслями по этому поводу.

Легко! Смотреть сериал в оригинале и все с теми же субтитрами wink


Ушла в себя и заблудилась (с)
 
сайберДата: Среда, 28.10.2009, 16:46 | Сообщение # 11
Новичок
Награды: 0

Группа: Персонал больницы
Сообщений: 8
Карма: 0
Статус: Offline
Quote (aleksa_castle)
Смотреть сериал в оригинале и все с теми же субтитрами

принимается )) . свежий взгляд на вещи - это всегда прекрасно)))

единственная проблема здесь - даже видя субтитры (английские) не всегда все понятно. вот если бы были видеоплейры которые могут показывать сразу двое субтитров - русский и английский. можно конечно смотреть допустим с английскими субтитрами а русские открыть рядом в текстовом файле или как-то так - но это не удобно имхо.

 
aleksa_castleДата: Среда, 28.10.2009, 16:55 | Сообщение # 12
Диагност
Награды: 1

Группа: Персонал больницы
Сообщений: 12991
Карма: 24048
Статус: Offline
Quote (сайбер)
единственная проблема здесь - даже видя субтитры (английские) не всегда все понятно. вот если бы были видеоплейры которые могут показывать сразу двое субтитров - русский и английский. можно конечно смотреть допустим с английскими субтитрами а русские открыть рядом в текстовом файле или как-то так - но это не удобно имхо.

ну зачем все так усложнять? Мало кто успевает следить за действием и читать одни субтитры wacko
Предлагаю разбить на этапы, в зависимости от уровня английского
Оригинал+русские субтитры
Оригинал+английские субтитры
Оригинал
biggrin


Ушла в себя и заблудилась (с)
 
Dr_SvetaДата: Среда, 28.10.2009, 21:16 | Сообщение # 13
Психотерапевт
Награды: 0

Группа: Персонал больницы
Сообщений: 1604
Карма: 788
Статус: Offline
А я в плеер запихивала сразу и русские и английские сабы.) Были некоторые глюки, но это возможно. Только с русскими теряется смысл просмотра в оригинале.

Everybody lies. © Dr.Gregory House
People don't change. © Dr.Gregory House
 
Форум » О сайте » Департамент Переводов » Частота употребления слов в сериале
  • Страница 1 из 1
  • 1
Поиск:



Форма входа

Наш баннер

Друзья сайта

    Smallville/Смолвиль
    Звёздные врата: Атлантида | StarGate Atlantis - Лучший сайт сериала.
    Анатомия Грей - Русский Фан-Сайт

House-MD.net.ru © 2007 - 2009

Данный проект является некоммерческим, поэтому авторы не несут никакой материальной выгоды. Все используемые аудиовизуальные материалы, размещенные на сайте, являются собственностью их изготовителя (владельца прав) и охраняются Законом РФ "Об авторском праве и смежных правах", а также международными правовыми конвенциями. Эти материалы предназначены только для ознакомления - для прочих целей Вы должны купить лицензионную запись. Если Вы оставляете у себя в каком-либо виде эти аудиовизуальные материалы, но не приобретаете соответствующую лицензионную запись - Вы нарушаете законы об Интеллектуальной собственности и Авторском праве, что может повлечь за собой преследование по соответствующим статьям существующего законодательства.