Звук вокруг Пособие по работе со звуком на смартфоне

Центр “Камерата” 2019 год

Оглавление

Вступление

С развитием технологий мы всё больше и больше полагаемся на мобильность. Нам больше не нужен компьютер, чтобы просмотреть, к примеру, электронную почту. Нам больше не нужен компьютер, чтобы купить билет на поезд, или самолёт, нам больше не нужен компьютер, чтобы просмотреть присланные электронные документы: таблицы, презентации. Даже музыку мы слушаем на телефоне: в дороге, ожидая транспорт, да и просто в свободное время.
Обработка звука – одна из немногих областей, в которой мы пока ещё не можем обходиться без компьютера. Мощностей современных телефонов и удобства пока не хватает для полноценной работы со звуком без компьютера, однако, записать звук приемлемого качества мы вполне можем и на нашем телефоне.

  • Студенты могут записывать лекции;
  • Специалисты доклады на семинарах, на которые они ездят для повышения квалификации;
  • Продвинутые пользователи могут записывать аудиоруководства и подкасты.

Вот только несколько возможных применений записи звука на телефоне. Кстати, о записи подкастов мы поговорим отдельно и это будет значительная часть нашего пособия.

История записи звука

Прежде, чем начать говорить о записи звука на смартфоне, давайте посмотрим, как вообще развивалась запись звука: с чего всё начиналось и к чему, в конечном итоге, всё пришло.

Музыкальные инструменты сопровождают человечество уже несколько тысячелетий, но в историческом масштабе человек научился записывать и воспроизводить свой собственный голос совсем недавно. За каких-то 100 с небольшим лет человечество прошло дорогу от фонографа к компакт-диску и флешкам. Это было увлекательное путешествие, во время которого неоднократно появлялись новые, более совершенные устройства записи и воспроизведения звука.

От цилиндра к пластинке

Любопытно, что первые устройства записи и воспроизведения звука были схожи с механизмами музыкальных шкатулок. И в тех, и в других использовался валик (цилиндр), а затем и диск, который, вращаясь, делал возможным звуковое воспроизведение. Однако началось все даже не с музыкальных шкатулок, а с европейских колокольных перезвонов.
Здесь, а именно во фландрийском городе Мелехен, с XIV века научились отливать хроматически настроенные колокола. Собранные вместе, они соединялись с помощью проволочной трансмиссии с клавиатурой наподобие органной и такая музыкальная конструкция называлась карильон. Кстати, по-французски Мелехен звучит как Малин – вот откуда пошло выражение “малиновый звон”. Человеческая мысль не стояла на месте, и очень скоро карильоны стали оборудовать уже упоминавшимися цилиндрами, на поверхности которых в определенном порядке располагались штифты. Эти штифты цепляли либо молоточки, которые били по колоколам, либо – языки колоколов.
В конце XVIII века валик с выступами стал применяться в более миниатюрных устройствах – музыкальных шкатулках, где вместо колоколов стали использовать хроматически настроенные гребни с металлическими пластинами. В XIX веке центром по производству музыкальных шкатулок с часовым механизмом стала Швейцария. А в 1870 году один немецкий изобретатель и вовсе решил использовать вместо валика диск, положив начало широкой популярности шкатулок со сменными дисками.
Однако самые различные механические музыкальные механизмы (шкатулки, табакерки, часы, оркестрионы и т.п.) не были способны дать человечеству главного – сделать возможным воспроизведение человеческого голоса. За эту задачу во второй половине XIX века взялись лучшие умы Старого и Нового света, и в этой заочной гонке победил американец Томас Алва Эдисон (Thomas Alva Edison). Однако здесь нельзя не вспомнить француза Шарля Кро (Charles Cros), который также был человеком талантливым и разносторонне одаренным. Он занимался (и не без успеха) литературой, автоматическим телеграфом, проблемами цветной фотографии и даже “возможными связями с планетами”.
30 апреля 1877 года Кро подал во Французскую Академию наук описание аппарата для записи и воспроизведения речи – “палефона”. Француз предлагал использовать не только “валик”, но и “диск со спиральной записью”. Только вот спонсоров для своего изобретения Кро не нашел.
Совсем по-другому развивались события В США. Сам Эдисон так описывал тот момент, когда его посетила поистине гениальная мысль: “Однажды, когда я еще работал над улучшением телефона, я как-то запел над диафрагмой телефона, к которой была припаяна стальная игла. Благодаря дрожанию пластинки игла уколола мне палец, и это заставило меня задуматься. Если бы можно было записать эти колебания иглы, а потом снова провести иглой по такой записи, почему бы пластинке не заговорить?”
По своему обыкновению, Эдисон не стал медлить, а приступил к созданию невиданного дотоле устройства. В том же 1877 году, когда Шарль Кро описал свой “палефон”, Эдисон отдал своему механику Джону Крузи чертеж довольно простого устройства, сборку которого он оценил в 18 долларов. Однако собранный аппарат стал первой в мире “говорящей машиной” – Эдисон громко пропел в рожок популярную английскую детскую песенку: “У Мэри был барашек” (“Marie had a little lamb”), а устройство воспроизвело “услышанное”, хотя и с большими помехами.
Принцип действия фонографа, так окрестил Эдисон свое детище, базировался на передаче звуковых колебаний голоса на поверхность вращающегося цилиндра, покрытого оловянной фольгой. Колебания наносились острием стальной иглы, один конец которой был соединен со стальной мембраной, улавливающей звуки. Цилиндр необходимо было вращать вручную с частотой один оборот в секунду. Работа с фонографом началась 18 июля 1877 года, так записано в книге лабораторных записей Эдисона. 24 декабря была подана патентная заявка, а 19 февраля 1878 года Эдисон получил патент под номером 200521.
Сказать, что фонограф произвел международный фурор – значит не сказать ничего. Однако конструкция фонографа не позволяла получить качественного воспроизведения, хотя сам Эдисон многие годы после создания первого фонографа вносил в устройство усовершенствования. Возможно, Эдисону нужно было бы сосредоточиться на создании (или модернизации) иных аппаратов звукозаписи, ибо фонограф (как и графофон разработки Белла (Bell) и Тайнтера (Taynter) был тупиковой ветвью в развитии индустрии записи/воспроизведения звука. Однако Эдисон слишком любил свой фонограф за его уникальность, потому присутствием в нашей жизни более удобных аудионосителей мы обязаны американскому изобретателю немецкого происхождения – Эмилю Берлинеру (Emile Berliner), безмерно раздвинувшему горизонты звукозаписи.
Конечно, Берлинер не изобрел современные CD, но именно он в 1887 году получил патент на изобретение граммофона, в котором в качестве аудионосителя использовались пластинки. Берлинер перебрался в США в 1870 году, где получил работу в телефонной компании Александра Белла и запатентовал угольный микрофон. Хорошо знакомый с устройством и фонографа, и графофона, он, тем не менее, обращается к идее использования диска, которая, как мы уже знаем, была “успешно” похоронена Французской Академией наук.
В аппарате, названном граммофоном, Берлинер использовал стеклянный диск, покрытый сажей, на который осуществлялась поперечная запись. 26 сентября 1887 года Берлинер получил на граммофон патент, а 16 мая следующего года продемонстрировал устройство во Франклиновском институте в Филадельфии. Очень скоро Берлинер отказывается от диска с сажей и прибегает к методу кислотного травления. Диск теперь брался цинковый, покрытый тонким слоем воска. Запись процарапывалась иридиевым острием, после чего диск подвергали травлению в 25% хромовой кислоте. Менее чем через полчаса появлялись канавки глубиной около 0,1 мм, затем диск отмывали от кислоты и использовали по назначению.
Заслуга Берлинера состояла также и в том, что он осознал необходимость копирования записи с оригинала (матрицы). Возможность тиражирования аудиозаписей – краеугольный камень всей современной звукозаписывающей индустрии. В этом направлении Берлинер работал очень упорно. Сначала, в 1888 году, он создает первую грампластинку-копию из целлулоида Хиата, которая ныне находится в Национальной библиотеке Вашингтона. Но целлулоидные диски плохо хранились и быстро изнашивались, потому Берлинер пробует другие материалы, в частности, стекло, бакелит и эбонит. В 1896 году Берлинер применяет в пластинке смесь шеллака, шпата и сажи.
Шеллачную массу и процесс прессования грампластинок для Берлинера разработал Луи Розенталь (Louis Rosenthal) из Франкфурта. На сей раз качество удовлетворило изобретателя, и подобная шеллачная масса использовалась для создания грампластинок до 1946 года.
Поразительно, но шеллак являлся застывшей смолой органического происхождения, в образовании которой принимают участие насекомые семейства лаковых червецов. Но даже шеллачная масса была далека от совершенства: грампластинки из нее получались тяжелыми, хрупкими и толстыми.
Одновременно с этим Берлинер усердно трудился над совершенствованием граммофонов, понимая, что необходимо увеличивать число любителей грамзаписи и, тем самым, рынок сбыта.
В 1897 году Берлинер и Элдридж Джонсон (Eldridge Jonson) открыли в США первую в мире фабрику по производству грампластинок и граммофонов – “Victor Talking Machine Co.”. Затем, в Великобритании, Берлинер создает компанию “E. Berliner’s Gramophone Co.” Уже к началу 1902 года компании предприимчивого изобретателя реализовали свыше четырех миллионов грампластинок!
Прогресс не обошел и Россию – в 1902 году на оборудовании фирмы Берлинера было сделано восемь первых записей легендарного русского певца Федора Шаляпина.
Однако и граммофон не избежал коренной модернизации – в 1907 году служащий французской фирмы “Патэ” Гильон Кеммлер (Kemmler) решил размещать громоздкий рупор внутри граммофона. Новые аппараты стали называться “патефонами” (по названию фирмы-производителя) и заметно облегчали свою переноску. Впоследствии (начиная с 50-х годов XX века) патефоны были вытеснены более совершенными электропроигрывателями, на которых проигрывались легкие и практичные виниловые диски.
Виниловые пластинки изготавливались из полимерного материала винилит (в СССР – из полихлорвинила). Скорость проигрывания снизилась с 78 до 33 1/3 оборотов в минуту, а длительность звучания – до получаса для одной стороны. Данный стандарт стал самым популярным, хотя широкое хождение имели пластинки других форматов, в частности, со скоростью вращения 45 оборотов в минуту (так называемые сорокопятки).

Магнитная запись

Возможность преобразования акустических колебаний в электромагнитные была доказана Оберлином Смитом (Oberlin Smith), изложившим принцип магнитной записи на стальную проволоку в 1888 году. Здесь также не обошлось без Томаса Эдисона, ибо на эксперименты с магнитной записью Смита вдохновило посещение знаменитой лаборатории Эдисона. Но только в 1896 году датский инженер Вальдемар Поульсен (Valdemar Poulsen) сумел создать работоспособное устройство, названное телеграфон.
В качестве носителя выступала стальная проволока. Патент на телеграфон был выдан Поульсену в 1898 году. Основополагающий принцип аналоговой записи звука путем намагничивания носителя с тех пор остался неизменным. На записывающую головку, вдоль которой на постоянной скорости проходит носитель (позднее им стала более удобная лента), подается сигнал с усилителя, в итоге носитель намагничивается в соответствии со звуковым сигналом. При воспроизведении носитель проходит уже вдоль воспроизводящей головки, индуцируя в ней слабый электрический сигнал, который, усиливаясь, поступает в динамик.
Магнитная плёнка была запатентована в Германии Фрицем Пфлеймером (Fritz Pfleumer) в середине 20-х годов прошлого века. Поначалу лента изготавливалась на бумажной основе, а впоследствии – на полимерной. В середине 30-х годов ХХ века немецкая фирма BASF наладила серийный выпуск магнитофонной ленты, создававшейся из порошка карбонильного железа либо из магнетита на диацетатной основе.
Примерно в то же время фирма AEG запустила в производство студийный аппарат магнитной записи для радиовещания. Устройство назвали “магнетофон”, в русском языке оно преобразовалось в “магнитофон”.
Принцип “высокочастотного подмагничивания” (когда в записываемый сигнал добавляется высокочастотная составляющая) предложили в 1940 году немецкие инженеры Браунмюль (Braunmull) и Вебер (Weber) – это дало значительное улучшение качества звука.
Бобинные магнитофоны стали использоваться с 30-х годов прошлого века. В конце 50-х появились картриджи, но все же наибольшую популярность снискали компактные и удобные кассетные магнитофоны.
Первый “кассетник” был создан голландской фирмой Philips в 1961 году. Пиком развития магнитофонов стоит считать появление плееров Sony марки “Walkman” в 1979 году. Эти маленькие устройства без возможности записи произвели фурор, ибо теперь любимую музыку можно было слушать на ходу, занимаясь спортом и т.п. Кроме того, человек с плеером не мешал окружающим, ибо слушал аудиозаписи в наушниках. Позднее появились плееры с возможностью записи.

Цифровой звук

Стремительное развитие в конце 70-х годов XX века компьютерных технологий привело к появлению возможности хранения и считывания любой информации в цифровом виде с соответствующих носителей. И здесь развитие уже цифровой аудиозаписи пошло двумя путями.

  • Вначале появился и получил широчайшее распространение компакт-диск;
  • Позднее, с появлением вместительных жестких дисков, в массы пошли программы-плееры, которые воспроизводили сжатые аудиозаписи.

В итоге, развитие флэш-технологий в начале XXI века привело к тому, что уже компакт-диски (имеется в виду формат Audio-CD) оказались под угрозой забвения, как это произошло с пластинками и кассетами.
Однако вернемся в 1979 год, когда компании Philips и Sony начали производство лазерных дисков. Sony, кстати, привнесла свой метод кодирования сигнала – PCM (Pulse Code Modulation) который использовался в цифровых магнитофонах. Последние обозначались аббревиатурой DAT (Digital Audio Tape) и применялись для профессиональной студийной звукозаписи.
Массовое производство компакт-дисков стартовало в 1982 году в ФРГ. Постепенно оптические диски перестают быть исключительно носителями аудиозаписей. Появляются CD-ROM, а затем CD-R и CD-RW, где уже можно было хранить любую цифровую информацию. На CD-R ее можно было записывать однократно, а на CD-RW – записывать и многократно перезаписывать с помощью соответствующих приводов.
Информация на компакт-диске записывается в виде спиральной дорожки из “питов” (углублений), выдавленных на поликарбонатной подложке и “Лендов” (промежутков между ними). Считывание/запись данных осуществляется с помощью лазерного луча.
Алгоритмы сжатия информации помогли существенно уменьшить размер цифровых аудиофайлов без особых потерь для человеческого слухового восприятия. Наибольшее распространение получил формат mp3, и теперь mp3-плеерами именуют все компактные проигрыватели цифровой музыки, хотя они, безусловно, поддерживают и другие форматы, в частности, тоже довольно популярные wma и ogg. Формат MP3 (сокращение от англ. MPEG-1/2/2.5 Layer 3) также поддерживается любыми современными моделями музыкальных центров и DVD-плееров. В нем применен алгоритм сжатия с потерями, которые несущественны для восприятия ухом человека. Размер MP3-файла со средним битрейтом 128 кбит/с по размеру примерно равен 1/10 от оригинального файла формата Audio-CD.
Формат MP3 был разработан рабочей группой института Фраунгофера, руководимой Карлхайнцем Бранденбургом (Karlheinz Brandenburg) в сотрудничестве с ATT Bell Labs и Thomson. В основу MP3 положили экспериментальный кодек ASPEC (Adaptive Spectral Perceptual Entropy Coding).
Программа L3Enc стала первым кодировщиком в формат MP3 (выпущена летом 1994 года), а первым программным MP3-плеером – Winplay3 (1995 год).

Принципы оцифровки звука

Перед тем, как мы начнём говорить непосредственно о записи звука на смартфоне, давайте немного поговорим о том, как оцифровывается звук. У нас нет цели перегружать вас теоретическими знаниями, однако, не обсудив этого момента, вы просто не сможете понять: какие именно параметры для оцифровки звука необходимы именно вам и именно в вашей конкретной ситуации. Не волнуйтесь, мы, по возможности, не будем перегружать наше пособие научными терминами и выкладками, а описывать всё будем на простых примерах.

Частота дискретизации

Наверняка, вы хоть раз слышали это понятие. Более того, многие из вас даже могут сказать нечто вроде “частота дискретизации 44100 герц”, или 44.1 килогерца”. Но давайте поговорим о том, почему так важна эта частота дискретизации.
Звук оцифровывается с помощью устройства, которое называется аналогово-цифровой преобразователь. В нашем пособии мы будем называть его просто АЦП.
АЦП работает следующим образом: аналоговый звук с помощью мембран и магнитной катушки преобразовывается в электрические колебания (как правило это происходит в микрофонах), а электрические колебания уже записываются в виде нулей и единиц. Называть АЦП комплект из микрофона и собственно того, что преобразует электрические колебания в нули и единицы не совсем правильно, но мы с вами не в академии наук, нам с вами надо просто понять принцип оцифровки, так что давайте мы и дальше будем представлять АЦП именно таким образом.
Электрические колебания преобразовываются в нули и единицы не постоянно. В силу физических причин, АЦП может это делать с интервалами. Интервалы эти называются отсчётами. Давайте рассмотрим это на практике и проведём эксперимент.

  • Включите радио, или аудиокнигу. Одним словом материал, в котором будет чей-то голос о чём-то рассказывать;
  • Заткните уши;
  • Теперь начинайте убирать руки от ушей и снова затыкать уши, скажем, раз в 10 секунд. На короткое время откройте уши и снова закройте руками;
  • Ускорьтесь, скажем, до одного открытия ушей раз в 5 секунд;
  • Теперь ещё ускорьтесь и начинайте открывать уши раз в секунду;
  • А теперь ещё ускорьтесь и начните открывать уши уже раз в полсекунды.

Давайте обсудим наш эксперимент.
Когда мы заткнули уши, мы вообще перестали слушать наше радио, или аудиокнигу. Когда мы начали открывать уши раз в 10 секунд, мы просто слышали фоновый шум и обрывки фраз. Когда мы ускорились до пяти секунд, мало что изменилось, всё тот же фоновый шум и обрывки фраз. Когда мы ускорились до секунды, мы стали понимать отдельные слова, а вот, когда мы ускорились до полсекунды, мы стали понимать уже целые фразы.

Что показывает этот эксперимент? Он показывает следующее: чем больше отсчётов в секунду совершит АЦП, тем большее количество звука он может “захватить”.
Этот принцип сформулирован в теореме Котельникова (в некоторых других источниках теореме Шеннона-Найквиста). Если понятными словами, то принцип этот звучит так:
“Для гарантированной оцифровки звука количество отсчётов должно быть в 2 раза больше, чем самая верхняя частота цифруемого звука”.

Так откуда же взялись 44100 герц? А всё оттуда же. Было условлено, что практически никогда нам не нужно оцифровывать сигнал, верхняя частотная граница которого будет выше 22050 герц. Так что, согласно теореме Котельникова, для оцифровки такого сигнала АЦП должен совершать 44100 отсчётов в секунду, иначе говоря, работать с частотой дискретизации 44100 герц.

Битовая глубина

Ещё одним важным параметром при оцифровке звука является битовая глубина, или количество бит на отсчёт. Чтобы понять, почему и на сколько это важно, мы так же проведём эксперимент.

  • Включим любую музыку, лучше классическую, в которой есть длинные паузы;
  • На первом этапе мы должны охарактеризовать играющую музыку только одним словом “да”. Если мы произносим “да”, то в данный момент звук есть, иначе звука нет;
  • На втором этапе к слову да, мы добавим слова “тихо” и “громко, таким образом, мы можем охарактеризовать музыку уже тремя словами: да, тихо, громко;
  • На третьем этапе мы сможем уже называть музыкальные инструменты, которые играют, например: барабан, гитара, скрипка.

Что показывает этот эксперимент? Он показывает, что чем большими словами мы можем описать звучащую музыку, тем точнее мы сможем передать её.

Поскольку у АЦП нет человеческих слов, вместо этого он использует биты. Так что, чем большим количеством битов АЦП сможет описать цифруемый звук, тем более качественной получится оцифровка.
В зависимости от ситуации, оцифровка может происходить со следующей битовой глубиной:

  • 4 бита (применялось в первых цифровых стандартах сотовой связи);
  • 8 бит (применяется сейчас в стандарте сотовой связи GSM);
  • 16 бит (начало применяться на аудио компакт-дисках и применяется в большей части случаев оцифровки звука);
  • 24 бита (применяется в Hi-Fi аппаратуре, а так же при написании музыки на компьютере);
  • 32 бита (Применяется в Hi-End аппаратуре и студийной записи и обработке звука).

Из всего изложенного выше мы можем сделать вполне обоснованный вывод: для нормальной оцифровки нам с вами вполне хватит частоты дискретизации 44100 герц и битовой глубины 16 бит.

Моно, или стерео

Теперь давайте коснёмся вопроса: в каком же режиме нам цифровать наш звук – моно, или стерео? Различие между этими режимами следующее:

  • В режиме моно звук снимается одним источником и оцифровывается в оба канала. Иначе говоря, в обоих каналах мы получим полностью идентичный звук;
  • В режиме стерео звук снимается двумя источниками и оцифровывается раздельно с каждого из источников. Таким образом, в каждом канале будет звук от разных источников.

Многие скажут: “Конечно, надо цифровать исключительно в стерео, ведь звук будет лучше!”, увы, это не совсем так. Посудите сами: зачем нам цифровать наш голос двумя источниками сразу, если мы, к примеру, рассказываем что-то под запись и ходим кому-то переслать.
С другой стороны, если мы, к примеру, сидим в компании и поём песни под гитару. Такое вполне можно цифровать в стерео, ведь компания наша большая, люди находятся в разных местах и оцифровка в стерео поможет нам передать атмосферу помещения и атмосферу находящихся в нём людей.
Так же иногда в стерео можно цифровать и интервью. Возможно, это будет удобно для последующей обработки, ведь один человек будет говорить в одном канале, а другой в другом. Однако, после конечной обработки, возможно, вам все равно придется свести всё в монорежим, ибо интервью в итоге должно быть цельным, монолитным, а звучащие по разным каналам голоса будут отвлекать о сути интервью.
Таким образом из вышенаписанного можно сделать такой вывод:

  • Если мы записываем одного человека, всегда пишем в моно;
  • Если мы хотим передать атмосферу помещения, или атмосферу нахождения множества людей в помещении, цифруем в стерео.

Сжимать, или не сжимать

При оцифровке звука немаловажным вопросом является ещё и то, как именно сохранять оцифрованный звук. Многие из вас могут сказать: “конечно, исключительно без потерь, ведь тогда мы сможем обработать этот звук на компьютере и сжать уже готовый и обработанный файл!”. Они, разумеется, будут правы, но только отчасти.
Дело в том, что несжатый звук будет занимать достаточно много места и, к сожалению, в нашем смартфоне просто может нехватить памяти для оцифрованного звука.
Кроме того, иногда мы вовсе не планируем ничего делать со звуком, в том смысле, что не планируем его обрабатывать. Скажем, один студент, который заболел и не сможет прийти на лекцию, попросил другого студента записать лекцию на диктофон смартфона и после окончания лекции отправить запись тому студенту, который заболел. В этом случае для заболевшего студента будет гораздо больше нужна сама лекция, нежели то, как именно её обработают. Кроме того, если это будет нужно заболевшему студенту, он и сам может обработать эту лекцию: обрезать конец и начало, выровнять звук, удалить шум.
На самом деле, вполне можно писать цифруемый звук и в сжатые форматы. Таким образом мы экономим память в смартфоне, а так же можем сразу поделиться записанным звуком. Главное тут, не переборщить со сжатием, особенно, если мы планируем в будущем обрабатывать записанный материал на компьютере.
Известный всем формат mp3 является форматом с потерями. Что это значит? Это значит то, что сжав файл в mp3 и потом разжав, мы получим два совершенно разных файла. Ключевым параметром сжатых форматов с потерями является битрейт. Чем выше битрейт, тем меньше степень потерь.
Если вы хотите сжимать файл в mp3 с наименьшей степенью потерь, используйте самый высокий битрейт: 320 килобит в секунду, хотя при этом файл будет иметь несколько больший размер. Если же размер данных вам критичен, вы можете понизить битрейт, но старайтесь не понижать его ниже 128 килобит в секунду даже при записи голоса, если планируете в будущем обрабатывать звук на компьютере.
Неплохим решением для экономии свободного места и улучшения качества записанного материала может послужить использование формата aac, или его контейнера m4a. Формат aac был разработан позже, чем mp3 и при его разработке были учтены все проблемы формата mp3.
Согласно исследованиям, формат aac при битрейте в 2 раза ниже, чем формат mp3, способен сжимать звук с таким же количеством потерь. Проще говоря, это выглядит вот так:

  • Битрейт aac 256 аналогичен битрейту mp3 512;
  • Битрейт aac 160 аналогичен битрейту mp3 320;
  • Битрейт aac 64 аналогичен битрейту mp3 128.

Выше мы с вами говорили, что, если у вас совсем критично с местом, то вы можете снизить битрейт mp3 до 128 килобит в секунду, но, используя формат aac, или его контейнеры, вы сможете ещё в 2 раза снизить размер файла, относительно mp3 128, или же в 2 раза улучшить качество, используя, например, битрейт aac 128. Более того, использование aac с битрейтом 128 кажется нам наиболее приемлемым сочетанием качества и размера.
В доказательство наших слов можем сказать то, что, например, сервис Apple Music хранит все свои десятки миллионов треков в контейнере m4a, который, как мы теперь знаем, есть ни что иное, как формат aac, с битрейтом всего в 256 килобит в секунду. Это, как мы уже знаем, по качеству равно mp3 с битрейтом 512 килобит в секунду. А ведь у mp3 такого битрейта даже нет. Максимальный битрейт mp3, напомним, 320 килобит в секунду.

Обработка звука на компьютере

Не смотря на то, что говорим мы о записи звука на смартфоне, может оказаться так, что без помощи компьютера нам не обойтись:

  • Удалять шум, выравнивать громкость гораздо быстрее на компьютере;
  • Сводить и монтировать, в случае, если вы, например, пишете подкаст, тоже гораздо удобнее на компьютере;
  • Наконец сконвертировать исходный файл для последующего его распространения тоже наиболее удобнее на компьютере.

Вопросы монтажа, сведения, конвертирования на компьютере выходят за рамки нашего пособия, но мы постараемся дать несколько общих советов. Так же несколько советов мы дадим в части нашего пособия, посвящённой подкастам и аудиоруководствам.
Работайте только с несжатым звуком. Если вы будете многократно пересохранять звук в формат с потерями, то после нескольких сохранений его качество ухудшится даже при самом высоком битрейте. Иначе говоря:

  • Перед сохранением сконвертируйте ваш файл в формат wav 44100 герц 16 бит, или даже 24 бита;
  • Обработайте ваш файл по потребностям;
  • После завершения всех обработок и только, когда вы будете уверены, что дальнейшая обработка файлу будет не нужна, сконвертируйте его в сжатый формат mp3, aac, или его контейнеры.
    Неплохой идеей будет оставить на некоторое время и несжатый вариант файла после завершения обработки. Вдруг вы решите что-то ещё поправить и в этом случае у вас останется несжатый файл, обработка которого не повредит качеству, ну а дообработанный файл всегда можно ещё раз сконвертировать, удалив первую, в нашем примере, не очень удачную копию.
  • К оглавлению

Приложения для записи звука на смартфоне

Как не удивительно, но этот раздел, вероятно, будет самым коротким в нашем пособии. Дело в том, что рекомендовать что-либо, а тем более настаивать на этом, как на единственно верном – занятие неблагодарное. Тем не менее, пожалуй, несколько рекомендаций мы всё-таки дадим.
По возможности используйте встроенное приложение “Диктофон”, которое есть в большинстве смартфонов. Часто его функциональность далека до идеала, но выполняет свою работу встроенное приложение надёжно и безупречно. Во встроенном приложении, как правило, есть возможность настройки качества записи.
Если вам необходима стерео-запись, воспользуйтесь сторонними приложениями, например, ASR для Android. Приложение позволяет тонко настраивать параметры записи, а так же автоматически выкладывать записи на облачные сервисы.
Владельцам iPhone, вероятно, неудастся записывать в режиме стерео из-за ограничений платформы, однако, сторонние приложения могут сделать процесс извлечения записей более комфортным.

Очень рекомендуем вам заиметь, если вы ещё этого не сделали, аккаунты в различных облачных сервисах, например, Dropbox, Яндекс-диск, CloudMailRu. Это позволит вам отправлять записанные файлы в облако без помощи компьютера. Для владельцев iPhone, к тому же это ещё и более удобный способ извлечения записей.

Запись подкастов и аудиоруководств

Плавно подходим к последней теме нашего пособия. Подкасты и аудиоруководства в последнее время приобрели в среде незрячих и слабовидящих большую популярность. Зачастую подкастами и аудиоруководствами сейчас заменяются текстовые и пошаговые инструкции.
Выразив долю сомнения в том, что подкасты и аудиоруководства всегда гораздо лучше воспринимаются, чем текстовые, тем не менее мы вынуждены поговорить о том, как правильно их записывать.
К сожалению, большая часть подкастов и аудиоруководств, которые записывают незрячие и слабовидящие весьма далека от сколь-нибудь нормального звучания: посторонние звуки, речевые, смысловые и стилистические ошибки делают эти подкасты трудными для восприятия.
Ниже мы, на сколько это возможно, попробуем высказать своё видение этой проблемы и дать несколько рекомендаций. Разумеется, эти рекомендации не претендуют на правильность в последней инстанции, однако, с их помощью вы можете научиться делать аудиоматериалы приемлемого качества.
Самое, пожалуй, главное для человека, собирающегося записать подкаст на какую-либо техническую тему, – это понимание того, в полной мере он владеет темой подкаста или нет.
К сожалению, весьма часто бывает так, что подкастеры очень неадекватно подходят к правильности и доскональности изложения материала в угоду тому, чтобы попросту стать известными в определённых кругах. Это очень серьёзная проблема, которая в ста процентах случаев ведёт к тому, что потом такие подкасты слушают люди, учатся по ним и в итоге начинают использовать какие-нибудь, например, функции программы о которых рассказал неграмотный подкастер, именно в том понимании, о которых было рассказано. Естественно, что далее при их использовании у пользователя возникает даже ещё больше вопросов, чем было до прослушивания подкаста, записанного полуграмотным подкастером. Амбициозность некоторых таких подкастеров уже вовсю даёт плоды такого подхода к созданию обучающих аудиоматериалов и это ни для кого не является секретом. Ведь стоит открыть какую-нибудь техническую рассылку и посмотреть, что там пишут люди, можно набрести на очень интересные, в кавычках, вопросы, которые напрямую являются порождением того, о чём говорилось выше.
Делаем выводы, что, если те, кто собирается записывать аудиоруководства, или подкасты, хотят известности, но не владеют материалом во всей его полноте, то есть два пути:

  • Путь первый: для начала, пройти обучение самому – здесь не имеется в виду поездка на какие-нибудь курсы КСРК и т.д., дело сводится к вдумчивому прочтению мануала, может быть, какой-нибудь дополнительной литературы, которой сейчас немало в сети, к посещению тематических форумов с целью поиска недостающих сведений;
  • Путь второй: пренебреч рекомендациями, изложенными выше, но тогда последующее прослушивание такого материала целевой аудиторией станет очень опасным и не поможет ничему и никому, кроме самого подкастера, который попросту получит временную славу, то есть достигнет своей изначальной цели.

Тема будущего аудио-руководства должна быть изначально пригодной для изучения именно в таком формате. Чем более специальнее или специфичнее знания, которыми желает поделиться подкастер, тем меньше у него к этому возможностей именно в формате аудиоподкаста. Одно дело, когда человек обучает аудиторию, рассматривая возможности какой-нибудь программы, отдельной её функции или чего-то похожего, а совсем другое, если, например, речь идёт о каком-нибудь программировании или о чём-нибудь столь же специфическом.
При демонстрации функций программы ошибки хоть и могут возникнуть, но они обусловлены только грамотностью или неграмотностью того, кто это объясняет, в случае же с программированием или чем-то не менее сложным, речь уже пойдёт о том, что подкастеру придётся не просто объяснять какие-то конкретные вещи на примерах, но и диктовать какие-то формулы, специфические команды и прочее. Так вот, в этом случае вероятность того, что люди, которые будут учиться по этому аудиоматериалу, наделают ошибок, вырастает почти до ста процентов.
Как уже говорилось ранее, прежде чем записывать подкаст, человек должен проверить свои знания, а уж только потом пытаться делиться ими путём записи подкаста на ту или иную тему.
Ни один, даже продвинутый, пользователь не в состоянии, пользуясь только лишь знаниями, что называется, из головы, изложить материал таким образом, чтобы человек, который абсолютно не в теме, мог потом включить подкаст и в полной мере освоить предлагаемую программу или что-то ещё. Поэтому к записи подкаста нужно обязательно готовиться, не полагаясь на то, что подкастер всё и так знает и без проблем сможет рассказать/показать. Пробелы в его знаниях будут почти наверняка и их надо обязательно восполнить перед записью. Нужно понимать, что по этому руководству будут учиться люди и поэтому необходимо провести тщательнейшую подготовительную работу, чтобы дать слушателям максимально полные знания.
Подкастер должен позаботиться о том, чтобы его речь была грамотной и не замусоренной сленговыми оборотами, фразами, не относящимися напрямую к теме подкаста и прочее. Сюда же нужно отнести и обязательное наличие хорошей дикции, чтобы людям, которые потом будут слушать такой подкаст, было комфортно и чтобы всё, что говорит подкастер было максимально понятно.
Речь здесь не идёт о том, чтобы дикция подкастера была такой, как, например, на радио или на телевидении, ибо всё-таки там работают профессионалы и перед тем, как выходить в эфир или записывать какие-нибудь рекламные ролики, они долго нарабатывают хорошую дикцию. Здесь же можно обойтись сносным уровнем дикции, но всё равно нужно стараться чтобы она была настолько лучшей, насколько подкастер вообще может этого добиться.
Материал подкаста должен быть изложен максимально чётко, понятно, последовательно и лаконично. Это не значит, что нужно стараться рассказать всё за одну минуту. Речь здесь в большей степени идёт о том, чтобы подкастер позаботился о последовательности изложения материала, при котором каждое следующее предложение логически вытекало бы из предыдущего. Каждый следующий раздел подкаста был бы продолжением предыдущего, конечно, насколько это возможно. Пользователь, который потом включит подкаст и будет учиться по нему, должен получить не просто все знания, но получить их так, чтобы он мог построить в голове некую картину, где было бы всё взаимосвязано, логично и понятно.
Подкастер не должен в середине какого-нибудь предложения резко вспоминать о том, что он что-то не сказал, что касается какой-то вещи из предыдущего раздела или из того, что было в начале этого раздела, который звучит в данный момент, и начинать восполнять этот пробел. Если такое случилось и подкастер обнаружил, что он чего-то не учёл и о чём-либо не рассказал, то нужно каким-либо образом пометить это для того, чтобы не забыть, далее дописать то, что он рассказывает/показывает в данный момент, а потом только сделать паузу, записать то, о чём он вспомнил и уже потом, при монтаже, вставить этот кусок туда, куда нужно, чтобы он был на своём месте. Таким образом подкастер сможет избежать путаницы и не нарушит последовательности излагаемого материала, что потом, в свою очередь, не собьёт с толку слушателей этого подкаста.
в идеале, хорошо было бы перед записью написать подробный сценарий подкаста. Это здорово упростит процесс его записи и поможет избежать различного рода недочётов и прочих неприятных моментов.
Подкастер должен обязательно позаботиться о том, чтобы расположить микрофон или смартфон, в микрофон которого он будет говорить, таким образом, чтобы его речь была максимально разборчивой, но не перегруженной плевками в микрофон и прочими артефактами. Нужно сделать несколько тестовых записей, послушать, что получается, найти нужное положение микрофона и только потом непосредственно записывать подкаст.
Также обязательно нужно избежать всевозможных отвлекающих фоновых, не относящихся к подкасту, звуков. Понятное дело, что подкасты зачастую записываются в домашних условиях, поэтому необходимо обеспечить максимальную тишину во время записи. Подкастер должен установить скорость синтезатора речи, при помощи которого он будет демонстрировать работу в какой-нибудь программе, на такой уровень, который будет понятен подавляющему большинству слушателей. Свои личные предпочтения, касающиеся этого аспекта, необходимо полностью исключить. Зачастую продвинутые пользователи устанавливают очень высокую скорость синтезатора и привыкают к ней. И вот когда наступает момент и такой пользователь хочет поделиться знаниями с окружающими, он забывает о том, что не всем комфортно воспринимать речь синтезатора на столь высокой скорости. Нужно помнить о том, что не всем такая скорость может быть приемлима, поэтому стоит к этому аспекту отнестись с пониманием. Задача подкастера состоит в том, чтобы тому, кто будет слушать записанный им подкаст, всё было максимально понятно, поэтому стоит пожертвовать скоростью синтезатора в пользу меньших значений с тем, чтобы людям не приходилось по многу раз перематывать назад и пытаться понять, что же там этот синтезатор пробормотал.
Очень часто случается так, что звук синтезатора пишется подкас тером в тот же микрофон, в который говорит он сам, и это может давать некоторые искажения. То есть синтезатор слышится не так, как сам пользователь слышит его из динамиков устройства, с которым работает. Это необходимо также учитывать. Ещё сюда же следует отнести и тот факт, что подкастер может пользоваться каким угодно синтезатором речи, но это не значит, что речь этого синтезатора понятна абсолютному большинству. Необходимо позаботиться также о выборе при записи подкаста того синтезатора, который наиболее распространён.
Необходимо перед записью определить, каким образом будет записываться подкаст. Предлагаются следующие варианты:

  • раздельная начитка речи и последовательная запись всех сюжетов с демонстрацией чего-либо на том устройстве, на котором непосредственно эта демонстрация осуществляется. Проще говоря, так: в процессе подготовки сочиняем текст, далее начитываем его, далее отдельно записываем все демонстрации и монтируем с речью таким образом, чтобы складывалось впечатление, будто вы сидите и в реальном времени рассказываете и показываете что-либо;
  • Можно использовать 2 смартфона или любых других устройства для записи подкаста. В одно устройство пишем речь, с другого подаём звук, например, в компьютер. Пишем всё в реальном времени, следя за тем, чтобы не пострадала цельность материала, и потом сводим это всё в каком-нибудь многодорожечном редакторе. Таким образом мы добьёмся того эффекта, что слушатель будет воспринимать как вашу речь хорошо, так и звуки с устройства, на котором осуществляется демонстрация, будут звучать в точности также, как если бы он сам их слышал на своём устройстве. То есть звук с устройства будет идти не в микрофон, в который вы разговариваете, а записываться напрямую.

Что первый, что второй способ – очень трудоёмкие и затратные по времени, но, в конечном итоге, это и будет считаться по-настоящему хорошим подкастом, который сможет, при соблюдении всех рекомендаций, которые были даны в пособии, стать, если можно так выразиться, эталонным. Пользователи будут слушать такой подкаст не только с целью научиться чему-нибудь, но и попросту с удовольствием.
Хотелось бы посоветовать всё-таки не использовать музыку в качестве фонового подклада или в началах и концах глав подкаста, так как она здорово отвлекает внимание учащегося. Внимание человека во время прослушивания подкаста должно быть целиком и полностью сосредоточено на том, что происходит в данный момент и следует избегать всего, что может эту сосредоточенность нарушить.
На время записи подкаста необходимо перевести смартфон или любые другие устройства, задействованные в подкасте в авиа-режим, а также повыключать всевозможные ICQ, скайпы, электронные почты и прочее, чтобы в процессе записи не возникало всяких разных посторонних звуков или телефонных звонков, от которых на этапе редакции вам придётся избавляться. Также всё перечисленное выше обязательно будет очень сильно сбивать ваше внимание и вы обязательно что-нибудь упустите в процессе записи.
Сведение и монтаж подкаста хоть и можно и, более того, вероятно, удобнее делать на компьютере, который, кстати говоря, не обязательно должен быть с процессором последнего поколения с наличием подключённых к нему дорогущих звуковых карт и прочей дорогостоящей периферии, но также маломальский монтаж можно сделать и непосредственно на смартфоне.
При начитывании текстовой части подкаста нужно постараться не монтировать куски фраз, чтобы в итоге не ощущалось так называемых склеек. Лучше отработать какую-нибудь словесную конструкцию и только потом её записать с тем, чтобы она звучала цельно. Если нужно, можно использовать дубли при записи, добиваясь наиболее лучшего звучания реплики, а потом убирать лишние куски.
Также следует избегать всевозможных речевых импровизаций. Лучше сначала отшлифовать текст, что называется, на бумаге, а затем его просто начитать. В случае, если подкаст задумывается как нечто объёмное, то его необходимо разделить на главы как логически, так и физически. Такой подкаст необходимо разделить на файлы, а эти файлы необходимо понятно подписать, чтобы пользователю не приходилось искать в общей мешанине, где находится та или иная тема или какой-нибудь момент подкаста, который ему может понадобиться в последствии. В случае, если вы предпочитаете просто нумеровать файлы, запишите всю нужную информацию, например, номер глав, названия частей в тегах файлов. Практически все програмные и аппаратные плееры умеют демонстрировать теги файлов.
Также в начале каждой главы необходимо называть её. Дело в том, что, если файлов несколько, то какой-то из них может быть либо случайно переименован, либо упущен при копировании подкаста слушателями, поэтому номер и название главы, произнесённые в начале файла здорово облегчат жизнь и смогут исправить некоторые неприятные ситуации.
Лучшая обработка окончательной версии подкаста – это не использовать обработку вообще. Под обработкой имеется в виду наложение всевозможных эффектов на записанный звук – эквализации, реверберации, компрессии и прочих. Большинство пользователей не имеет детального представления о том, как работают те или иные эффекты, в каких случаях и как применяются и тд, поэтому лучше отказаться от их использования, ведь это может, в конечном итоге, испортить всю вашу работу, проделанную до того, и подкаст будет слушаться очень тяжело. Дело в том, что естественная речь и слушается естественно. Но стоит вам с чем-то техническим переборщить, то тот, кто это потом будет слушать, сразу поймёт, что что-то в звуке не так. И это уже будет отвлекать его внимание от темы подкаста, а то и здорово сбивать. То есть произойдёт то, чего мы пытались избежать на протяжение всей работы над подкастом.

Заключение

Мы с вами поговорили о звуке и о том, как записывать его при помощи смартфона, поговорили о том, как наиболее грамотно сделать подкаст, а в заключении кратко подведём итоги.

  • При записи звука пользуйтесь частотой дискретизации 44100 герц и битовой глубиной 16 бит;
  • При записи звука в сжатый формат не опускайте битрейт ниже 128 килобит в секунду;
  • При  записи подкастов старайтесь избегать фоновых шумов, артефактов, обязательно проводите тестовые записи перед тем, как приступить, собственно, к записи подкаста;
  • Не используйте обработку звука, если вы не понимаете, что вы делаете. Если вы считаете, что звук требует обработки, попробуйте обратиться к тем, кто в этом понимает больше вас.

Вот, пожалуй и всё, что мы хотели рассказать вам в этом пособии. Надеемся, что наш материал поможет вам в записи звука, а так же, что материал просто был вам интересен.

Дмитрий Бахров

Александр Валиев

Опубликовано yuniks

Самый злобный человек на земле

Оставьте комментарий