|
|
|
Рождественская Светлана Викторовна | Сайт учителя начальных классов
Сайт учителя начальных классов
Профессия: учитель начальных классов
Профессиональные интересы: обучение на высоком уровне сложности
Увлечения: вязание
Регион: Оренбургская область
Населенный пункт: г. Гай
Место работы: Муниципальное бюджетное общеобразовательное учреждение “Гимназия”
Навигация
Последние записи в блоге
Все записи
Ссылка на мой мини-сайт:
https://nsportal.ru/gaiswetlanaПоделиться:
Воспитание и обучение – великое дело. Им решается участь человека.
В.А.Сухомлинский
Я – Рождественская Светлана Викторовна, учитель начальных классов. Очень рада приветствовать вас на страницах своего сайта.
На страницах сайта хотелось бы поделиться важными событиями, происходящими в жизни нашей школы и моего класса, а также достижениями в работе.
Буду очень рада получить от вас, мои дорогие читатели, ваши рецензии, ценные замечания и полезные советы.
О себе
Возраст: 49 лет
Образование: высшее
Стаж работы: 30 лет
23 года являюсь руководителем методического объединения учителей начальных классов
Участник сетевых сообществ:
– ИКТ В начальной школе. Сеть творческих учителей;
– Всероссийский Интернет-педсовет
– ПроШколу
Публикации в печати:
- Педагогическое общение как условие развития личности учителя и ученика в целостном педагогическом процессе. (Проблемы культуры образования: теория и практика (на основе деятельности гимназии г.Гая). Коллективная монография: научный руководитель к.пед.н. Л.Б.Соколова. – Оренбург, 1998. – 53 с.)
- «Дидактическая модель проведения уроков с применением Интернет-технологий» в номинации: «Разработка уроков с применением Интернет-технологий»
- «Открытый урок с использованием ресурсов сети Интернет для Президента России»
- Общероссийский конкурс открытых уроков по системе общего развития Л.В.Занкова, посвящённом 10-летию Корпорации «Фёдоров»
- Академия творческой педагогики (АТП) Редакция газеты «Педагогический вестник» Москва-Сочи
- Фестиваль педагогических идей «Открытый урок»
- Энциклопедия «Одарённые дети. Будущее России» №2 г. Москва
Книги, которые сформировали мой внутренний мир
Много таких книг
Мой взгляд на мир
В нашей нелёгкой, но очень интересной и творческой работе мы должны действовать вместе. Быть сотоварищами в учебном процессе, партнёрами, составлять союз с
учениками, родителями, коллегами.
Мои достижения
- Почётная грамота Городского отдела образования г.Гая Оренбургской области
- Благодарность Городского отдела образования г.Гая Оренбургской области
- Диплом за внедрение инновационных программ национального проекта «Образование»
- Благодарность Федерального научно-методического центра им. Л.В.Занкова
- Диплом Академии творческой педагогики, город Москва – Сочи
- Грамота за активное участие в реализации программы развития гимназии
- Свидетельство участника регионального конкурса Министерства Оренбургской области
- Сертификат участника Всероссийского Интернет-конкурса по созданию уроков с использованием разработок Единой коллекции цифровых образовательных ресурсов
- Почётная грамота Министерства Оренбургской области
- Почётная грамота Министерства образования Российской Федерации
- Грамота за активное участие в Х-й Международной Интернет-Олимпиаде среди образовательных учреждений «Эрудиты планеты – 2011» с участием команд из России и зарубежных стран (командный зачёт), 2011г. , г.Москва
- Диплом за участие во Всероссийском конкурсе презентаций «ТопСлайд» в номинации «Педагогические работники», 2011, автономная некоммерческая организация, Центр поддержки инициатив в сфере образования и науки
- Диплом за огромную работу, проводимую в сфере воспитания молодёжи, достижение высоких результатов в Международной Олимпиаде «Эрудиты планеты – 2012» для студентов и школьников с участием лучших команд из 61-го образовательного учреждения России и зарубежных стран, г.Москва, 2012г.
- Грамота за огромную работу, проводимую в сфере воспитания и за подготовку участников Международной Олимпиады «Эрудиты планеты – 2012» для студентов и школьников России и зарубежных стран, г.Москва, 2012
- Грамота за огромную работу, проводимую в сфере воспитания и за подготовку участников Международной Олимпиады «Эрудиты планеты – 2012» для студентов и школьников России и зарубежных стран, г.Сочи, 2012
- Грамота за проведение мастер-класса по теме «Развитие коммуникативной компетентности младших школьников на уроках русского языка» в рамках работы III Всероссийского Слёта учителей, г. Сочи, 2012
- Грамота за представленный материал методической разработки урока на секции «Педагогическая мастерская» в рамках работы III Всероссийского Слёта учителей, г.Сочи, 2012
- Диплом за активное участие в работе семинара «Использование новых технологий в деятельности педагога в условиях введения ФГОС» в рамках работы Международной олимпиады школьников и студентов «Эрудиты планеты – Сочи – 2012»
- Грамота за высокую подготовку участников к Международной олимпиаде школьников «Эрудиты планеты – Сочи – 2013»
- Сертификат за огромную работу, проводимую в сфере воспитания молодёжи и за подготовку участников Международной Олимпиады «Эрудиты планеты – 2013» для студентов и школьников с участием лучших команд из России, Эстонии, Казахстана, Украины и Белоруссии, г.Москва
- Диплом за профессиональную организацию и подготовку команды к участию в Международной Олимпиаде «Эрудиты планеты – 2013» для студентов и школьников с участием лучших команд из России, Эстонии, Казахстана, Украины и Белоруссии, г. Москва
- Грамота за организацию и проведение мониторингового конкурса «Эму – Эрудит 2013»
- Грамота за организацию и проведение мониторингового конкурса «Эму – Специалист 2014»
- Грамота городского отдела образования за подготовку победителя городской олимпиады по математике, 2013г.
- Грамота за высокую подготовку участников к Международной олимпиаде школьников «Эрудиты планеты – Сочи – 2013»
- Благодарность за вклад в развитие творческого потенциала и поддержку инициатив педагогов на Четвёртом Всероссийском Слёте учителей, 2013г.
- Сертификат Всероссийского Слёта учителей за проведение мастер-класса по теме «Применение инновационных технологий в начальной школе», г.Сочи, 2013
- Сертификат Всероссийского Слёта учителей за проведение мастер-класса по теме «Технология проблемного обучения в начальной школе в свете новых образовательных стандартов», г.Сочи, 2013
- Сертификат за активное участие в работе семинара по теме «Психологические и педагогические аспекты ФГОС для начальной, основной и старшей школы и внеурочной деятельности» в рамках работы «4-го Всероссийского Слёта Учителей – Сочи – 2013»
- Диплом за подготовку участников-победителей Всероссийских предметных олимпиад в 2012, 2013году
- Благодарность Центра поддержки талантливой молодёжи за организацию и проведение Всероссийских предметных олимпиад для младших школьников, 2013
- Диплом «Учитель цифрового века» за активное применение в работе современных информационных технологий, эффективное использование цифровых предметно-методических материалов, предоставленных в рамках проекта, 2013
- Диплом за 1 – ое место в городском конкурсе методических разработок «Современный урок в начальной школе в рамках ФГОС» в номинации «Разработка урока на основе системно-деятельностного подхода, направленного на формирование универсальных учебных действий», 2013
- Диплом общероссийского конкурса «Педагогическое мастерство на уроках в начальной школе» III-ей степени, 2013
- Диплом за обобщение опыта работы по теме «Использование метода проектов в урочной и внеурочной деятельности с целью формирования УУД» на Пятом Международном Слёте Учителей Сочи – 2014 (очное участие), г. Сочи, 2014г.
- Диплом за обобщение опыта работы по теме «Игровые формы обучения как средство развития навыков сотрудничества младших школьников на уроках русского языка» на Пятом Международном Слёте Учителей Сочи – 2014 (очное участие), г.Сочи, 2014г.
- Сертификат организатора Всероссийского конкурса по русскому языку и литературе «Родное слово», 2013г., 2014г.
- Сертификат участника круглого стола по преемственности в работе учителей начальных классов и учителей-логопедов по теме «Пути решения проблемы трудностей в овладении чтением и письмом», 2013г.
- Сертификат организатора Всероссийского конкурса по естествознанию «Это знают все!», 2014
- Благодарность за организацию и проведение Всероссийской олимпиады (физико-математический цикл; гуманитарный цикл), 2014
- Благодарность за активное участие в проекте «V Всероссийский математический конкурс «Ребус», 2014
- Сертификат за размещение авторской работы «Приставки и предлоги» в фотокаталоге «Лучшие педагоги – исследователи России – 2013», г. Москва
- Золотой сертификат за подготовку к участию в дистанционном конкурсе: Международный интеллектуальный интернет-марафон «ЭДУКОНец» учащихся 1-ых классов, ставших призёрами и за организацию и проведение конкурса, 2014
- Золотой сертификат за организацию и проведение дистанционного конкурса: Международный интеллектуальный интернет-марафон ЭДУКОНец», 2014
- Благодарность за организацию и проведение Всероссийской викторины «Человек и космос», 2014
- Благодарность Оргкомитета Всероссийского математического турнира «Зелёная математика» – 2013/2014 за подготовку и педагогическое сопровождение участников конкурса среди учащихся 1-ых классов на базе МБОУ «Гимназия», г.Гай на высоком уровне, 2014
- Благодарность Оргкомитета Всероссийского интеллектуального конкурса «Классики» – 2013/2014 за подготовку и педагогическое сопровождение участников конкурса среди учащихся 1-ых классов на базе МБОУ «Гимназия», г.Гай на высоком уровне, 2014
- Сертификат за подготовку участников Всероссийского математического турнира «Зелёная математика», 2014
- Сертификат за подготовку участников Всероссийского интеллектуального конкурса «Классики», 2014
- Свидетельства за подготовку победителей мероприятия проекта videouroki. net «Дистанционная олимпиада по математике, русскому языку, лит
- Благодарность за активное участие в работе международного проекта по литературному чтению, окружающему миру, 1 класс», 2014 для учителей videouroki.net
- Сертификат за огромную работу, проводимую в сфере воспитания молодёжи и подготовку участников Международной олимпиады «Эрудиты планеты – 2014» для студентов и школьников с участием лучших команд, г.Сочи, 2014г.
- Благодарность за активное участие в работе международного проекта для учителей videouroki.net, 10.10.2014г.
- Диплом за подготовку победителя Константинова Ивана во Всероссийской олимпиаде по русскому языку, г. Екатеринбург, октябрь, 2014г.
- Диплом за подготовку победителя Русиной Анны во Всероссийской олимпиаде по русскому языку и литературному чтению, г.Екатеринбург, октябрь, 2014г.
- Диплом за подготовку победителей Рындина Алексея и Ильиной Ксении во Всероссийской олимпиаде по русскому языку, г. Екатеринбург, октябрь, 2014г.
- Диплом за подготовку победителя Бубненко Марии Всероссийской викторины «Азбука нравственности», г.Екатеринбург, октябрь, 2014г.
- Свидетельство за подготовку победителя мероприятия проекта videouroki.net «Дистанционная олимпиада по окружающему миру. 2 класс», октябрь, 2014г.
- Свидетельство за подготовку победителя мероприятия проекта videouroki.net «Дистанционная олимпиада по математике. 2 класс», октябрь, 2014г.
- Свидетельство за подготовку победителя мероприятия проекта videouroki.net «Дистанционная олимпиада по русскому языку. 2 класс», октябрь, 2014г.
- Свидетельство за подготовку победителя мероприятия проекта videouroki.net «Дистанционная олимпиада по литературному чтению. 2 класс», октябрь, 2014г.
- Сертификат организатора Всероссийского конкурса по русскому языку и литературе «Родное слово», 2014г.
- Грамота за организацию и проведение мониторингового конкурса «Эму – Эрудит 2014», 2014г.
- Благодарственное письмо Оргкомитета Всероссийского интеллектуального конкурса «Классики 2014/2015» «Школа юных читателей» за подготовку и педагогическое сопровождение участников конкурса среди учащихся 4-ых классов на базе МБОУ «Гимназия», г. Гай на высоком уровне, г.Омск, 2014г.
- Благодарность за активное участие в работе международного проекта для учителей videouroki.net, декабрь, 2014г.
- Благодарственное письмо Оргкомитета Всероссийского интеллектуального конкурса «Классики» 2014/2015 «Школа юных читателей» за подготовку и педагогическое сопровождение участников конкурса среди учащихся 4 классов, г.Омск, 2014г.
Моё портфолио
Мне очень приятно видеть Вас на этой странице!
С удовольствием обменяюсь опытом работы. Буду признательна за отзывы.
Добавить учебный материал в портфолио
Добавить творческую работу ученика
Код для вставки списка публикаций на другие сайты
Мои публикации:
Математика
- План работы кружка “Занимательная математика” (для учащихся 4 классов)
Материалы для родителей
- Памятка для родителей
- Родители – первые учителя детей
Материалы МО
- Мастер – класс «Развитие коммуникативной компетентности младших школьников на уроках русского языка».
- Духовно-нравственное воспитание и развитие учащихся начальной школы
- Формирование универсальных учебных действий в начальной школе – требование времени
- Формирование УУД в начальной школе
Общепедагогические технологии
- Уровень сформированности учебно-познавательной компетентности
Русский язык
- Мастер – класс «Развитие коммуникативной компетентности младших школьников на уроках русского языка».
- План работы кружка “Занимательная грамматика”
- Предметная викторина по русскому языку “В царстве грамматики” (для учащихся 3-4 классов)
- Урок русского языка в 3 классе “Правописание мягкого знака после шипящих”
- Урок русского языка во 2 классе по теме “Ознакомление со способом проверки безударных гласных подбором однокоренных слов”
- урок русского языка во 2 классе по теме “Орфограммы корня”
Чтение
- Урок литературного чтения во 2 классе по теме: Братья Гримм “Храбрый портной”
- Элективный курс по литературному чтению “Моя любимая книжка” (для учащихся 2-4 классов)
Добавить грамоту в портфолио
Мои альбомы
Мои ученики
Моё портфолио
Мои фотографии
Создать альбом
Env – Документация гимназии
Переключить боковую панель оглавления
- класс
Основной класс Gymnasium для внедрения сред Reinforcement Learning Agents.
Класс инкапсулирует среду с произвольной закулисной динамикой посредством функций
step()
иreset()
. Среда может частично или полностью наблюдаться отдельными агентами. Для многоагентных сред см. PettingZoo.Основные методы API, которые необходимо знать пользователям этого класса:
step()
– Обновляет среду с помощью действий, возвращающих следующее наблюдение агента, вознаграждение за выполнение этих действий, если среда завершилась или усеклась из-за последнего действия и информации из среды о шаге, т.е. метрик, отладочной информации.reset()
– Сбрасывает среду в начальное состояние, необходимое перед вызовом шага. Возвращает первое наблюдение агента для эпизода и информацию, то есть метрики, отладочную информацию.render()
— Визуализирует окружение, помогая визуализировать то, что видит агент, примерами режимов являются «человеческий», «rgb_array», «ansi» для текста.close()
– Закрывает среду, что важно при использовании внешнего ПО, т.е. pygame для рендеринга, баз данных
Среды имеют дополнительные атрибуты для понимания пользователями реализации
action_space
— объект Space, соответствующий допустимым действиям, все допустимые действия должны содержаться в пространстве.Observation_space
— объект Space, соответствующий действительным наблюдениям, все действительные наблюдения должны содержаться в пространстве.reward_range
— Кортеж, соответствующий минимальному и максимальному возможному вознаграждению агента за эпизод. Диапазон вознаграждения по умолчанию установлен на \((-\infty,+\infty)\).спецификация
— спецификация среды, содержащая информацию, используемую для инициализации среды сспортзал.make()
метаданные
– Метаданные окружения, т. е. режимы рендера, рендер fpsnp_random
— Генератор случайных чисел для среды. Это автоматически назначается во времяsuper().reset(seed=seed)
и при оценкеself.np_random
.
См. также
Для изменения или расширения среды используйте тренажерный зал
. Оболочка
классаПримечание
Чтобы получить воспроизводимую выборку действий, начальное число можно задать с помощью
env.action_space.seed(123)
.
Методы
- gymnasium.Env.step( self , action: ActType ) → tuple[ObsType, SupportsFloat, bool, bool, dict[str, Any]]
Запустите один временной шаг динамики среды, используя действия агента.
Когда достигнут конец эпизода (
прекращено или усечено
), необходимо вызватьreset()
для сбросить состояние этой среды для следующего эпизода.Изменено в версии 0. 26: API Step был изменен: удалено
выполнено
в пользузавершено
иусечено
, чтобы сделать его более понятным пользователям, когда среда была прекращена или усечена, что имеет решающее значение для обучения с подкреплением алгоритмы начальной загрузки.- Параметры:
действие ( ActType ) — действие, предоставляемое агентом для обновления состояния среды.
- Возвращает:
наблюдение ( ObsType ) — элемент среды
наблюдательного_пространства
в качестве следующего наблюдения за действиями агента. Примером может служить массив numpy, содержащий позиции и скорости полюса в CartPole.награда ( SupportsFloat ) — Награда в результате совершения действия.
завершено ( bool ) — достигает ли агент конечного состояния (как определено в MDP задачи) который может быть положительным или отрицательным. Примером является достижение целевого состояния или перемещение в лаву из Саттон и Бартон, Gridworld. Если это правда, пользователю необходимо вызвать
reset()
.truncated ( bool ) — выполняется ли условие усечения вне области MDP. Как правило, это ограничение по времени, но его также можно использовать для обозначения того, что агент физически выходит за границы. Может использоваться для преждевременного завершения эпизода до того, как будет достигнуто терминальное состояние. Если это правда, пользователю нужно вызвать
сброс()
.info ( dict ) — содержит вспомогательную диагностическую информацию (полезную для отладки, обучения и регистрации). Это может, например, содержать: метрики, описывающие состояние производительности агента, переменные, которые скрытые от наблюдения, или отдельные условия вознаграждения, которые объединяются для получения общего вознаграждения. В OpenAI Gym
done ( bool ) — (устарело) Логическое значение, если эпизод закончился, и в этом случае дальнейшие вызовы
step()
будут возвращать неопределенные результаты. Это было удалено в OpenAI Gym v26 в пользу завершенных и усеченных атрибутов. Сигнал «готово» может быть выдан по разным причинам: может быть, задача, лежащая в основе среды, была успешно решена, был превышен определенный лимит времени или симуляция физики перешла в недопустимое состояние.
- gymnasium.Env.reset( self , * , seed: int | None = None , options: dict[str, Any] | None = None ) → tuple[ObsType, dict[str, Any] ]
Сбрасывает среду в начальное внутреннее состояние, возвращая исходное наблюдение и информацию.
Этот метод генерирует новое начальное состояние, часто с некоторой случайностью, чтобы гарантировать, что агент исследует пространстве состояний и изучает обобщенную политику в отношении окружающей среды. Эту случайность можно контролировать с
seed
параметр в противном случае, если среда уже имеет генератор случайных чисел иreset()
вызывается сseed=None
, RNG не сбрасывается.Следовательно,
reset()
следует (в типичном случае использования) вызывать с начальным значением сразу после инициализации и больше никогда.Для пользовательских сред первая строка
reset()
должна бытьsuper().reset(seed=seed)
, которая реализует посев правильный.Изменено в версии v0.25: Параметр
return_info
был удален, и теперь ожидается возврат информации.- Параметры:
seed ( необязательный int ) — seed, который используется для инициализации PRNG среды ( np_random ). Если в среде еще нет PRNG и передается
seed=None
(опция по умолчанию), начальное значение будет выбрано из некоторого источника энтропии (например, отметка времени или /dev/urandom). Однако, если в среде уже есть PRNG иseed =
не передается, PRNG будет сброшен , а не . Если вы передадите целое число, PRNG будет сброшен, даже если он уже существует. Обычно вы хотите передать целое число сразу после инициализации среды и никогда больше . Пожалуйста, обратитесь к минимальному примеру выше, чтобы увидеть эту парадигму в действии.параметры ( необязательный dict ) — дополнительная информация для указания способа сброса среды (необязательно, в зависимости от конкретной среды)
- Возвращает:
наблюдение ( ObsType ) — Наблюдение начального состояния. Это будет элемент
Observation_space
(обычно массив numpy) и аналогичен наблюдению, возвращаемомуstep()
.информация ( словарь ) – Этот словарь содержит вспомогательную информацию, дополняющую
наблюдение
. Он должен быть аналогиченинформация
возвращенаstep()
.
- gymnasium.Env.render( self ) → RenderFrame | список[RenderFrame] | Нет
Вычислить кадры рендеринга в соответствии с параметром
render_mode
во время инициализации среды.метаданных среды
режимов рендеринга ( env.metadata[“render_modes”] ) должны содержать возможные способы реализации режимов рендеринга. Кроме того, список версий для большинства режимов рендеринга достигается за счет gymnasium.make , который автоматически применяет оболочку для сбора визуализированных кадров.Примечание
Поскольку
render_mode
известен во время__init__
, объекты, используемые для визуализации состояния среды должен быть инициализирован в__init__
.По соглашению, если
render_mode
равно:Нет (по умолчанию): рендеринг не вычисляется.
«человек»: Окружающая среда постоянно отображается на текущем дисплее или терминале, обычно для восприятия человеком. Этот рендеринг должен происходить в течение
step()
иrender()
не нужно вызывать. ВозвращаетНет
.«rgb_array»: возвращает один кадр, представляющий текущее состояние среды. Кадр представляет собой
np.ndarray
с формой(x, y, 3)
, представляющей значения RGB для изображения пикселя x-by-y.«ansi»: возвращает строки (
str
) илиStringIO.StringIO
, содержащие текстовое представление в стиле терминала. для каждого временного шага. Текст может включать символы новой строки и escape-последовательности ANSI (например, для цветов).«rgb_array_list» и «ansi_list»: возможны версии режимов рендеринга на основе списка (кроме Human) через wrapper,
gymnasium. wrappers.RenderCollection
, которая автоматически применяется во времяgymnasium.make(..., render_mode="rgb_array_list")
. Собранные кадры извлекаются после вызоваrender()
илиreset()
.
Примечание
Убедитесь, что метаданные
вашего класса
"render_modes" 9Ключ 0018 включает в себя список поддерживаемых режимов.
Изменено в версии 0.25.0: Функция рендеринга была изменена, чтобы больше не принимать параметры, вместо этого эти параметры должны быть указаны в инициализированной среде, т. е.
gymnasium.make("CartPole-v1", render_mode="human")
Атрибуты
- Env.action_space : space.Space [ActType]
Объект Space, соответствующий допустимым действиям, все допустимые действия должны содержаться в пространстве. Например, если поле действия имеет тип Discrete и дает значение Discrete(2) , это означает, что есть два допустимых дискретных действия: 0 и 1.
>>> env.action_space Дискретный(2) >>> env.observation_space Box(-3.4028234663852886e+38, 3.4028234663852886e+38, (4,), float32)
- Env.observation_space :spaces.Space[ObsType]
Космический объект, соответствующий действительным наблюдениям, все действительные наблюдения должны содержаться в пространстве. Например, если пространство наблюдения имеет тип
Box
и форма объекта(4,)
, это означает, что правильное наблюдение будет массивом из 4 чисел. Мы также можем установить границы поля с помощью атрибутов.>>> env.observation_space.high массив([4.8000002e+00, 3.4028235e+38, 4.1887903e-01, 3.4028235e+38], dtype=float32) >>> env.observation_space.low массив([-4.8000002e+00, -3.4028235e+38, -4.1887903e-01, -3.4028235e+38], dtype=float32)
- Env.metadata : dict[str, Any] = {'режимы рендеринга': []}
Метаданные среды, содержащие режимы рендеринга, рендеринг fps и т. д.
- Env.render_mode : ул | Нет = Нет
Режим рендеринга среды, определенный при инициализации
- Env.reward_range = (-inf, inf)
Кортеж, соответствующий минимальному и максимальному возможному вознаграждению агента за эпизод. Диапазон вознаграждения по умолчанию установлен на \((-\infty,+\infty)\).
- Env.spec : EnvSpec | Нет = Нет
EnvSpec
среды, обычно устанавливаемой во времяgymnasium.make()
Дополнительные методы
- спортзал.Env.close( сам )
После того, как пользователь закончил работу со средой, close содержит код, необходимый для «очистки» среды.
Это критично для закрытия окон рендеринга, базы данных или HTTP-соединений.
- свойство Env.unwrapped : Env[ObsType, ActType]
Возвращает базовую среду без упаковки.
- Возврат:
Env – База без упаковки
спортзал.Env
экземпляр
- свойство Env.np_random : Генератор
Возвращает внутренний
_np_random
среды, который, если он не установлен, будет инициализирован случайным начальным числом.- Возврат:
Экземпляры `np.random.Generator`
Среды реализации
При реализации среды :meth:Env.reset и Env.step()
создаются функции, описывающие
динамика окружающей среды.
Для получения дополнительной информации см. руководство по созданию среды.
Упаковщики - Документация спортзала
Переключить боковую панель оглавления
Модуль классов-оболочек.
Оболочки — это удобный способ изменить существующую среду без непосредственного изменения базового кода. Использование оберток позволит вам избежать большого количества шаблонного кода и сделает вашу среду более модульной. Обертки могут
также быть прикованными, чтобы объединить их эффекты.
Большинство сред, созданных с помощью gymnasium.make()
, уже будут упакованы по умолчанию.
Чтобы обернуть среду, вы должны сначала инициализировать базовую среду. Затем вы можете передать эту среду вдоль с (возможно, необязательными) параметрами для конструктора оболочки.
>>> импортировать спортзал как спортзал >>> из gymnasium.wrappers импортировать RescaleAction >>> base_env = gym.make("Хоппер-v4") >>> base_env.action_space Коробка (-1.0, 1.0, (3,), float32) >>> wrapper_env = RescaleAction(base_env, min_action=0, max_action=1) >>>wrapped_env.action_space Коробка (-1.0, 1.0, (3,), float32)
Вы можете получить доступ к среде под первой оболочкой , используя атрибут gymnasium.Wrapper.env
.
Как gymnasium. Класс Wrapper
наследуется от gymnasium. Env
, затем gymnasium.Wrapper.env
может быть другой оболочкой.
>>> завернутый_env>>>>> >>> wrap_env.env >>>>
Если вы хотите попасть в окружение под все слоев оберток можно использовать gymnasium.Wrapper.unwrapped
атрибут.
Если среда уже является пустой средой, атрибут gymnasium.Wrapper.unwrapped
просто вернется сам.
>>> завернутый_env>>>>> >>> wrapped_env.unwrapped
Есть три общие вещи, которые вы можете захотеть сделать с помощью оболочки:
Преобразование действий перед их применением к базовой среде
Преобразование наблюдений, возвращаемых базовой средой
Награды преобразования, возвращаемые базовой средой
Такие обертки могут быть легко реализованы путем наследования от gymnasium. ActionWrapper
, спортзал.ObservationWrapper
или gymnasium.RewardWrapper
и реализующие соответствующее преобразование.
Если вам нужна оболочка для выполнения более сложных задач, вы можете напрямую наследоваться от класса gymnasium.Wrapper
.
Если вы хотите реализовать свою собственную оболочку, ознакомьтесь с соответствующим руководством.
спортзал.Обертка
- class gymnasium.Wrapper ( env: Env[ObsType, ActType] )
диапазон вознаграждений
иметаданных
атрибутов без изменения атрибутов базовой среды. Кроме того, эти оболочки могут изменить поведение методовstep()
иreset()
.Некоторые атрибуты (
spec
,render_mode
,np_random
) будут указывать на среду оболочки (т.е. к соответствующим атрибутамenv
).Note
Если вы наследуете от
Wrapper
, не забудьте вызватьсупер(). __init__(env)
- Параметры:
env — Окружающая среда для упаковки
Методы
- gymnasium.Wrapper.step( self , action: WrapperActType ) → tuple[WrapperObsType, SupportsFloat, bool, bool, dict[str, Any]]
Использует
step()
изenv
, который можно перезаписать для изменения возвращаемых данных.
- gymnasium.Wrapper.reset( self , * , seed: int | None = None , options: dict[str, Any] | None = None ) → tuple[WrapperObsType, dict[str, Any] ]
Использует
reset()
изenv
, которую можно перезаписать для изменения возвращаемых данных.
- спортзал.Wrapper.close( self )
Закрывает оболочку и
env
.
Атрибуты
- свойство Wrapper. action_space : space.Space[ActType] | пробелы.Space[WrapperActType]
Вернуть
Env
action_space
, если не перезаписано, тогда используется оболочкаaction_space
.
- свойство Wrapper.observation_space : space.Space[ObsType] | пробелы.Space[WrapperObsType]
Возврат конверта
пространство_наблюдения
, если не перезаписано, тогда используется оберткапространство_наблюдения
.
- свойство Wrapper.reward_range : кортеж [SupportsFloat, SupportsFloat]
Возврат
Env
reward_range
, если не перезаписан, тогда используется оберткаreward_range
.
- свойство Wrapper.spec : EnvSpec | Нет
Возвращает атрибут
Env
spec
с WrapperSpec , если оболочка наследуется от EzPickle .
- свойство Wrapper.metadata : dict[str, Any]
Возвращает метаданные
Env
- свойство Wrapper.np_random : Генератор
Возвращает
Env
np_random
атрибут.
- спортзал.Wrapper.env
Окружение (на один уровень ниже) этой обертки.
Это само по себе может быть обернутой средой. Чтобы получить среду под всеми слоями оберток, используйте
gymnasium.Wrapper.unwrapped
.
- свойство Wrapper.unwrapped : Env[ObsType, ActType]
Возвращает базовую среду оболочки.
Это будет голая среда
gymnasium.Env
под всеми слоями обертки.
Обертки для спортзала
Gymnasium предоставляет ряд часто используемых оберток, перечисленных ниже. Более подробную информацию можно найти в конкретном обертка в странице на обертке типа
Имя | Тип | Описание |
---|---|---|
| Разная упаковка | Реализует общую предварительную обработку, применяемую в средах Atari |
| Разная упаковка | Обернутая среда автоматически сбрасывается при достижении завершенного или усеченного состояния. |
| Оболочка действий | Обрезка непрерывного действия до допустимой границы, заданной средой action_space |
| Разная упаковка | Обеспечивает совместимость сред, написанных в API OpenAI Gym v0.21, чтобы они выглядели как среды Gymnasium |
| Обертка наблюдения | Фильтрует пробелы наблюдения словаря только запрошенными ключами |
| Обертка для наблюдения | Оболочка наблюдения, которая сглаживает наблюдение |
| Обертка для наблюдения | Оболочка AnObservation, которая последовательно складывает наблюдения. |
| Обертка для наблюдения | Преобразование наблюдаемого изображения из RGB в оттенки серого. |
| Разная упаковка | Разрешает визуализацию, подобную человеческой, для сред, поддерживающих визуализацию «rgb_array» |
| Обертка для наблюдения | Эта оболочка нормализует наблюдения s.t. каждая координата центрирована с единичной дисперсией. |
| Упаковка для наград | Эта обертка нормализует немедленные награды s.t. их экспоненциальная скользящая средняя имеет фиксированную дисперсию. |
| Разная упаковка | Это вызовет ошибку, если step или render вызывается перед reset |
| Обертка для наблюдения | Дополнить наблюдения значениями пикселей, полученными с помощью рендеринга , которые можно добавить к наблюдениям за окружающей средой или заменить их. |
| Разная упаковка | Это позволит отслеживать совокупные награды и продолжительность эпизодов, возвращая их в конце. |
| Разная упаковка | Эта оболочка будет записывать видеоролики о развертываниях. |
| Разная упаковка | Включить список версий режимов рендеринга, т. е. «rgb_array_list» для «rgb_array», чтобы рендеринг для каждого шага сохранялся в списке до рендер называется. |
| Оболочка действий | Масштабирует непрерывное пространство действий среды до диапазона [ min_action , max_action ], где min_action и max_action — пустые массивы или числа с плавающей запятой. |